几个月来处理自己的睡眠数据,一直得不到满意的结果。画出图来一看,是数据本身噪音特别大,就是所谓的“脏数据”。在导师的建议下,我再尝试一下处理Sleep-EDF的数据,看看别人的数据是不是也噪音那么大。如果所有的睡眠多导都伴随巨大的噪音,接下去一段时间我就要好好研究如何处理这些高噪音的脏数据。
Sleep-EDF数据集包含197个整夜的睡眠多导图睡眠记录,包含EEG、EOG、chin EMG以及事件marker。本文把有关的介绍翻译为中文并加上自己的理解,以备以后查阅。
Sleep-EDF与Sleep-EDFx数据集
两个数据集采集自同一时间段(1989-1994)的两个实验,实际上没有区别。Sleep-EDFx是Sleep-EDF的全集,所以原作者也推荐研究者直接使用Sleep-EDFx。
Sleep-EDF | Sleep-EDFx | |
---|---|---|
数据量 | 8个 | 197个 |
被试 | SC:4位健康白人 ST:4位轻度入睡障碍患者 |
SC:83位健康白人 ST:24位轻度入睡障碍患者 |
后缀名 | 数据文件为.rec 标签文件为 .hyp 实际均为EDF格式 |
数据文件为.edf 标签文件为 .edf 实际数据文件为EDF格式、标签文件为EDF+格式 |
SC和ST数据
无论是哪个数据集,其内部都存在两种文件:SC*
开头和ST*
开头的。它们实际上是来自于两个不同的实验所采集到的数据。
睡眠磁带数据 - SC | 睡眠遥感数据 - ST | |
---|---|---|
文件名规则 | 数据:SC4[2位被试号][1位夜晚序号]E0-PSG.edf 标签: SC4[2位被试号][1位夜晚序号]E[1位标注标签的医生代码]-Hypnogram.edf |
数据:ST7[2位被试][1位夜晚序号]J0-PSG.edf 标签: ST7[2位被试号][1位夜晚序号]J[1位标注标签的医生代码]-Hypnogram.edf |
数据记录方式 | 利用便携式的记录仪,并把采集的数据记录在盒式磁带上 | 利用射频发射的记录仪,将采集到的信号实时发射到计算机上 |
被试家里 | 医院 | |
采集时长 | 每位被试连续2天 | 每位被试2天,分别服用替马西泮和安慰剂(顺序见.xls 文件) |
研究内容 | 年龄对于健康人睡眠的影响 | 替马西泮对于轻度入睡障碍患者的作用 |
被试 | 25-101岁的健康白人被试 | 18-79岁的白人被试,具有轻度入睡障碍 |
脑电导联 | Fpz-Cz & Pz-Oz | Fpz-Cz & Pz-Oz |
事件Marker | / | [-31 or -30] 未接收到发射器信号 [1 or 2] 接收到了发射器信号,且信号来自于1号或2号发射器 [33 or 34] 医生或被试自己按下了记录仪的M键,产生了一个Marker |
标签含义
标签 | 含义 |
---|---|
W | 清醒 |
1 | NREM-1 |
2 | NREM-2 |
3 | NREM-3 |
4 | NREM-4 |
R | REM |
M | 体动 |
? or unscored | 未标注 |
Sleep-EDF数据集
.rec
和.hyp
扩展名的文件包含了欧洲数据格式(EDF)的原始数据和它们的睡眠图。-
数据采集自未使用任何药物的男性及女性白种人(21~35岁)。包含水平眼动、Fpz-Cz导联及Pz-Oz导联的头皮脑电,采样率为100Hz。
-
sc*
开头的记录还包含了颏下肌电包络线(submental-EMG envelope)、口鼻气流(oro-nasal airflow)、肛温(rectal body temperature)以及事件marker,采样率都是1Hz;而st*
开头的记录包含了采样率为100Hz的颏下EMG以及采样率1Hz的事件marker。 -
st*
开头的数据采集自人体穿戴式生物信号放大器,他们会将信号传输给PC。所有的发射器具有相同的调频频率,所以存在调频接收器混淆两个相邻的病人信号的可能。由于发射器和接收器位置的关系,这种风险其实非常小,但是为了确保每一发射器具有不同基线的ID + Sync + Error
信号。比方说st7132j0.rec
和st7052j0.rec
分别是由发射器1和2产生的,因此信号的基线是1和2。发射器具有一个marker (M)键:按下按钮就会在ID + Sync + Error
信号上加32。系统也会持续监测收到的(数字)信号的质量:任何错误都会从原信号上减去32。所以,ID + M - E
的大小表明发射器的ID,并将按压marker键作为正偏移(+M)、将遥感连接的错误标记为负偏移(-E)。所有的ST记录文件都是好的例子,由于光学的遥感连接在下午以及实验开始是不连接的。在实验开始(st7132j0.rec
的00:31:17和st7052j0.rec
的23:23:15),ID + Sync + Error
信号会从负数(错误:没有连接)切换至1或2(发射器的ID),几秒后病人或护士会按下marker按钮,这将会引起一个1秒长的正峰。 -
睡眠图则存储了基于Fpz-Cz/Pz-Oz的人工分期的R&K结果,而非使用C4-A1/C3-A2。睡眠阶段W、1、2、3、4、R、M以及'unscored'以二进制0、1、2、3、4、5、6和9标记。
-
4个
sc*
文件是在1989年从可走动的健康志愿者获得的他们24小时日常生活中获得的,使用了该进行的盒式磁带记录机。被试、记录和睡眠图标记都描述于MS Mourtazaev, B Kemp, AH Zwinderman, HAC Kamphuisen. Age and gender affect different characteristics of slow waves in the sleep EEG. Sleep (1995)
4个
st*
文件是在1994年从轻度入睡障碍患者(但其余方面很健康)获取的,记录了他们在医院一夜的情况,使用了信号质量很好的小型遥感系统。被试、记录和睡眠图标记都描述于B Kemp, AH Zwinderman, B Tuk, HAC Kamphuisen, JJL Oberye. Analysis of a sleep-dependent neuronal feedback loop: the slow-wave microcontinuity of the EEG. IEEE-BME (2000)
Sleep-EDFx数据集(扩展版本)
*PSG.edf
文件是包含Fpz-Cz导联及Pz-Oz导联的头皮脑电、水平眼动、颏下EMG和事件marker;SC*PSG.edf
文件还包含了口鼻气流(oro-nasal airflow)和肛温(rectal body temperature)。*Hypnogram.edf
文件包含对应于PSG文件的睡眠模式标注。包含W、R、1、2、3、4、M(运动)和?(未标注)。所有的睡眠图都是由受良好训练的技师根据R&K手册手工标注的(用文件名的第8个字母区分)。- PSG文件是EDF格式的,而hypnogram文件是EDF+格式的。
睡眠磁带研究及数据
153个SC*
文件(SC = Sleep Cassette)是在1987~1991年间一项年龄对睡眠的影响的研究中获得的,来自25岁至101岁的未服用任何睡眠相关药物的健康白人。大约20小时的两个PSG是在两个连续的昼夜周期在被试家中采集的。被试进行日常的行为,只是多戴了一个像随身听一样的盒式磁带记录机。
类似SC4ssNEO-PSG.edf
的文件名中,ss
是被试号码,N
是指夜晚。36号、52号被试的第一晚,以及13号被试的第二晚数据缺失了,因为磁带和光盘损坏了。
眼电(EOG)和皮层脑电(EEG)信号的采样率都是100Hz。颏下EMG信号进行了高通滤波、整流并进行低通滤波。最终EMG包络将会用μVrms (root-mean-square)表示,采样率为1Hz。口鼻气流、肛温和事件marker都是1Hz采样率。
被试和记录的详细信息在文件头及SC-subjects.xls
中描述。
睡眠遥感研究及数据
44个ST*
文件(ST = Sleep Telemetry)是在1994年的一项替马西泮对于睡眠的影响的研究中获得的,来自22个男性及女性白人,他们没有服用其他药物。被试具有轻度的入睡障碍,但是其他方面很健康。约9小时的两个PSG是在两个夜晚在医院采集的,其中一夜被试服用了替马西泮、另一夜服用了安慰剂。被试佩戴了信号质量很好的小型遥感系统。
类似ST7ssNJO-PSG.edf
的文件名中,ss
是被试号码,N
是指夜晚。
眼电(EOG)、肌电(EMG)和皮层脑电(EEG)信号的采样率都是100Hz,事件marker是1Hz采样率。生理marker的值表示遥感发射器编号(ID = 1 or ID = 2)。当有人按下marker (M)键时会产生一个正向偏移(+32),而存在错误时则会产生一个负向偏移(-32)。
被试和记录的详细信息在文件头及ST-subjects.xls
中描述。
参考与引用
[2] Sleep-EDF Database Expanded v1.0.0
本文特色图片(featured picture)来自 Creative Commons Attribution-Share Alike 3.0 Unported许可协议
Description
English: Screenshot of a PSG of a person in REM sleep.
Date 7 February 2013, 11:55:05
Source Own work
Author NascarEd
Sleep-EDF数据集及其扩展版本简介 由 赵匡是 采用 知识共享 署名-非商业性使用 4.0 国际 许可协议进行许可。
本许可协议授权之外的使用权限可以从 关于知识产权 处获得。
The community faced in 2020 the outbreak of coronavirus COVID-19, last wishes as not be the having said that Precise measures infatuated past numerous governments to bar the spread of the disease, including the finding enjoyment in or do closure of cinemas, forcing the industry to reform and locate remodelled ways to interact with the public. http://trsnell.com/artikkeleita/paras-video-pelit-marraskuuta-2018/video/ It transfer take several years earlier the further structure proves effective, covid-19SF3535sd$fsdfsdfsdf! as long as the whole world is excluded mist lovers are told to remember the most famous movies epidemics that filmmakers are white-livered to pass at near, and to compete with stories with reality.