Sleep-EDF数据集及其扩展版本简介

几个月来处理自己的睡眠数据,一直得不到满意的结果。画出图来一看,是数据本身噪音特别大,就是所谓的“脏数据”。在导师的建议下,我再尝试一下处理Sleep-EDF的数据,看看别人的数据是不是也噪音那么大。如果所有的睡眠多导都伴随巨大的噪音,接下去一段时间我就要好好研究如何处理这些高噪音的脏数据。

Sleep-EDF数据集包含197个整夜的睡眠多导图睡眠记录,包含EEG、EOG、chin EMG以及事件marker。本文把有关的介绍翻译为中文并加上自己的理解,以备以后查阅。

Sleep-EDF与Sleep-EDFx数据集

两个数据集采集自同一时间段(1989-1994)的两个实验,实际上没有区别。Sleep-EDFx是Sleep-EDF的全集,所以原作者也推荐研究者直接使用Sleep-EDFx。

  Sleep-EDF Sleep-EDFx
数据量 8个 197个
被试 SC:4位健康白人
ST:4位轻度入睡障碍患者
SC:83位健康白人
ST:24位轻度入睡障碍患者
后缀名 数据文件为.rec
标签文件为.hyp
实际均为EDF格式
数据文件为.edf
标签文件为.edf
实际数据文件为EDF格式、标签文件为EDF+格式

SC和ST数据

无论是哪个数据集,其内部都存在两种文件:SC*开头和ST*开头的。它们实际上是来自于两个不同的实验所采集到的数据。

  睡眠磁带数据 - SC 睡眠遥感数据 - ST
文件名规则 数据:SC4[2位被试号][1位夜晚序号]E0-PSG.edf
标签:SC4[2位被试号][1位夜晚序号]E[1位标注标签的医生代码]-Hypnogram.edf
数据:ST7[2位被试][1位夜晚序号]J0-PSG.edf
标签:ST7[2位被试号][1位夜晚序号]J[1位标注标签的医生代码]-Hypnogram.edf
数据记录方式 利用便携式的记录仪,并把采集的数据记录在盒式磁带上 利用射频发射的记录仪,将采集到的信号实时发射到计算机上
  被试家里 医院
采集时长 每位被试连续2天 每位被试2天,分别服用替马西泮和安慰剂(顺序见.xls文件)
研究内容 年龄对于健康人睡眠的影响 替马西泮对于轻度入睡障碍患者的作用
被试 25-101岁的健康白人被试 18-79岁的白人被试,具有轻度入睡障碍
脑电导联 Fpz-Cz & Pz-Oz Fpz-Cz & Pz-Oz
事件Marker / [-31 or -30] 未接收到发射器信号
[1 or 2] 接收到了发射器信号,且信号来自于1号或2号发射器
[33 or 34] 医生或被试自己按下了记录仪的M键,产生了一个Marker

标签含义

标签 含义
W 清醒
1 NREM-1
2 NREM-2
3 NREM-3
4 NREM-4
R REM
M 体动
? or unscored 未标注

Sleep-EDF数据集

  1. .rec.hyp扩展名的文件包含了欧洲数据格式(EDF)的原始数据和它们的睡眠图。

     

  2. 数据采集自未使用任何药物的男性及女性白种人(21~35岁)。包含水平眼动、Fpz-Cz导联及Pz-Oz导联的头皮脑电,采样率为100Hz。

  3. sc*开头的记录还包含了颏下肌电包络线(submental-EMG envelope)、口鼻气流(oro-nasal airflow)、肛温(rectal body temperature)以及事件marker,采样率都是1Hz;而st*开头的记录包含了采样率为100Hz的颏下EMG以及采样率1Hz的事件marker。

  4. st*开头的数据采集自人体穿戴式生物信号放大器,他们会将信号传输给PC。所有的发射器具有相同的调频频率,所以存在调频接收器混淆两个相邻的病人信号的可能。由于发射器和接收器位置的关系,这种风险其实非常小,但是为了确保每一发射器具有不同基线的ID + Sync + Error信号。比方说st7132j0.recst7052j0.rec分别是由发射器1和2产生的,因此信号的基线是1和2。发射器具有一个marker (M)键:按下按钮就会在ID + Sync + Error信号上加32。系统也会持续监测收到的(数字)信号的质量:任何错误都会从原信号上减去32。所以,ID + M - E的大小表明发射器的ID,并将按压marker键作为正偏移(+M)、将遥感连接的错误标记为负偏移(-E)。所有的ST记录文件都是好的例子,由于光学的遥感连接在下午以及实验开始是不连接的。在实验开始(st7132j0.rec的00:31:17和st7052j0.rec的23:23:15),ID + Sync + Error信号会从负数(错误:没有连接)切换至1或2(发射器的ID),几秒后病人或护士会按下marker按钮,这将会引起一个1秒长的正峰。

  5. 睡眠图则存储了基于Fpz-Cz/Pz-Oz的人工分期的R&K结果,而非使用C4-A1/C3-A2。睡眠阶段W、1、2、3、4、R、M以及'unscored'以二进制0、1、2、3、4、5、6和9标记。

  6. 4个sc*文件是在1989年从可走动的健康志愿者获得的他们24小时日常生活中获得的,使用了该进行的盒式磁带记录机。被试、记录和睡眠图标记都描述于

    MS Mourtazaev, B Kemp, AH Zwinderman, HAC Kamphuisen. Age and gender affect different characteristics of slow waves in the sleep EEG. Sleep (1995)

    4个st*文件是在1994年从轻度入睡障碍患者(但其余方面很健康)获取的,记录了他们在医院一夜的情况,使用了信号质量很好的小型遥感系统。被试、记录和睡眠图标记都描述于

    B Kemp, AH Zwinderman, B Tuk, HAC Kamphuisen, JJL Oberye. Analysis of a sleep-dependent neuronal feedback loop: the slow-wave microcontinuity of the EEG. IEEE-BME (2000)

Sleep-EDFx数据集(扩展版本)

  1. *PSG.edf文件是包含Fpz-Cz导联及Pz-Oz导联的头皮脑电、水平眼动、颏下EMG和事件marker;SC*PSG.edf文件还包含了口鼻气流(oro-nasal airflow)和肛温(rectal body temperature)。
  2. *Hypnogram.edf文件包含对应于PSG文件的睡眠模式标注。包含W、R、1、2、3、4、M(运动)和?(未标注)。所有的睡眠图都是由受良好训练的技师根据R&K手册手工标注的(用文件名的第8个字母区分)。
  3. PSG文件是EDF格式的,而hypnogram文件是EDF+格式的。

睡眠磁带研究及数据

153个SC*文件(SC = Sleep Cassette)是在1987~1991年间一项年龄对睡眠的影响的研究中获得的,来自25岁至101岁的未服用任何睡眠相关药物的健康白人。大约20小时的两个PSG是在两个连续的昼夜周期在被试家中采集的。被试进行日常的行为,只是多戴了一个像随身听一样的盒式磁带记录机。

类似SC4ssNEO-PSG.edf的文件名中,ss是被试号码,N是指夜晚。36号、52号被试的第一晚,以及13号被试的第二晚数据缺失了,因为磁带和光盘损坏了。

眼电(EOG)和皮层脑电(EEG)信号的采样率都是100Hz。颏下EMG信号进行了高通滤波、整流并进行低通滤波。最终EMG包络将会用μVrms (root-mean-square)表示,采样率为1Hz。口鼻气流、肛温和事件marker都是1Hz采样率。

被试和记录的详细信息在文件头及SC-subjects.xls中描述。

睡眠遥感研究及数据

44个ST*文件(ST = Sleep Telemetry)是在1994年的一项替马西泮对于睡眠的影响的研究中获得的,来自22个男性及女性白人,他们没有服用其他药物。被试具有轻度的入睡障碍,但是其他方面很健康。约9小时的两个PSG是在两个夜晚在医院采集的,其中一夜被试服用了替马西泮、另一夜服用了安慰剂。被试佩戴了信号质量很好的小型遥感系统。

类似ST7ssNJO-PSG.edf的文件名中,ss是被试号码,N是指夜晚。

眼电(EOG)、肌电(EMG)和皮层脑电(EEG)信号的采样率都是100Hz,事件marker是1Hz采样率。生理marker的值表示遥感发射器编号(ID = 1 or ID = 2)。当有人按下marker (M)键时会产生一个正向偏移(+32),而存在错误时则会产生一个负向偏移(-32)。

被试和记录的详细信息在文件头及ST-subjects.xls中描述。

参考与引用

[1] Sleep-EDF Database v1.0.0

[2] Sleep-EDF Database Expanded v1.0.0


本文特色图片(featured picture)来自 Creative Commons Attribution-Share Alike 3.0 Unported许可协议

Description
English: Screenshot of a PSG of a person in REM sleep.
Date 7 February 2013, 11:55:05
Source Own work
Author NascarEd

Sleep-EDF数据集及其扩展版本简介 由 赵匡是 采用 知识共享 署名-非商业性使用 4.0 国际 许可协议进行许可。
本许可协议授权之外的使用权限可以从 关于知识产权 处获得。

 

0 0 vote
Article Rating
Subscribe
提醒
guest
1 评论
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
MaratErews

The community faced in 2020 the outbreak of coronavirus COVID-19, last wishes as not be the having said that Precise measures infatuated past numerous governments to bar the spread of the disease, including the finding enjoyment in or do closure of cinemas, forcing the industry to reform and locate remodelled ways to interact with the public. http://trsnell.com/artikkeleita/paras-video-pelit-marraskuuta-2018/video/ It transfer take several years earlier the further structure proves effective, covid-19SF3535sd$fsdfsdfsdf! as long as the whole world is excluded mist lovers are told to remember the most famous movies epidemics that filmmakers are white-livered to pass at near, and to compete with stories with reality.