从临床研究数据管理角度设计病例报告表
卜擎燕,熊宁宁 ,邹建东 ,蒋萌 ,刘芳
(1南京中医药大学,南京210029;2南京中医药大学附属医院临床药理科,南京210029)
[摘要] 病例报告表(CRF)是临床研究数据获取的主要工具,其重要性仅次于方案。书面与电子CRF对于数据收集与数据管理的效率与数据质量有不同的影响。CRF设计属于临床研究数据管理(CDM)设计与计划阶段的一个程序步骤。因此,从CDM的角度出发,考虑CRF的设计要求、设计时点、流程与设计要点,不仅有助于获得正确、有效的数据,还能使数据管理的其他程序步骤的效率提高、错误发生率降低。
[关键词] 临床研究数据管理;病例报告表;临床研究
临床研究数据管理(CDM)的主要目标是及时获取正确、有效的数据,符合GCP及统计分析与报告的要求 。CDM始于临床试验的计划阶段,即在设计研究方案与病例报告表(Case report form,CRF)中就体现数据的采集与管理。除试验方案外,作为获取数据工具的CRF是最重要的,它与试验的顺利实施、数据质量和试验进程密切相关。如果设计的数据点不正确,无论后面的数据管理过程有多严格,都不可能得到正确的数据。CRF的设计不仅关系到数据采集过程的数据质量,还对原始资料核查(Source data verification,SDV)、数据审查、数据录入等环节的数据质量有重要影响。因此,必须高度重视CRF的设计。现主要从临床研究数据管理角度论述CRF的设计。
1 CRF的概念与分类
人用药物注册技术要求国际协调会议(ICH)对CRF的定义是:一种印刷的、可视的或者是电子版的文件,用于记录试验方案要求的每位受试者的所有信息,向申办者报告 。
1.1 书面CRF
书面CRF已为人们所熟知。书面CRF的版式主要有书式(Book type)、分册书式
和就诊分册式(Visit type)。书式CRF按照项目内容与时间顺序排列,每位受试者1册。分册式CRF的分册形式多样,最常见就诊分册式,即按就诊时点分册。每册CRF完成后,监查员即可进行SDV,然后回收该册CRF交付数据管理部门;还有按使用者分册,如医生用与受试者用CRF;按评价时期分册,以及按有效性项目、安全性项目、背景资料等项目来分册。目前国外大多采用就诊分册式CRF,而我国常见的是书式CRF。书式与就诊分册式CRF各有优缺点,见表1 。
表1 书式CRF与就诊分册式CRF特点比较(略)
相比较于书式CRF,采用就诊分册式CRF的临床试验,获取数据速度快,能够及时发现并尽早纠正试验中存在的问题,更有利于数据质量管理,特别适用于较长期的I临床试验。但却存在印刷成本增加、工作程序复杂化、占用大量存储空间等问题。因而,近年来越来越多的临床试验开始采用电子数据获取系统(Electronic data capture,EDC),具有实时数据存取、在线数据管理、无纸化等优点。
1.2 电子CRF(e-CRF)
随着EDC的普及使用,e—CRF往往与EDC相提并论,但两者是有区别的。EDC是为申办者收集电子的而非书面格式的临床试验数据的一项技术 。而临床数据交换标准协会(Clinical Data Interchange Standards Consortium,CDISC)对e-CRF
的定义为:① 根据试验方案设计的,可用于稽查的电子记录,用来记录试验方案要求的每位受试者的信息,向申办者报告。② CRF中的数据项与它们的关联的注释、注解与签名形成电子化的链接。注意:为收集或显示相链接的数据,e—CRF可能包含一些特殊的显示要素、电子逻辑检查及其他特殊的性质或功能 。 虽然制药业界有逐渐转向电子版CRF的趋势,许多国家的管理机构已接受或准备授受提交的电子数据,但目前大多数临床试验仍以书面CRF来收集数据。 2 CRF设计的要求
CRF设计的目标是收集完整而准确的数据,以作出有意义的分析。具体应做到:① 易于理解设计时考虑不同的使用者[研究者,临床研究协调员(Clinical
research coordinator,CRC),监查员,数据管理者,统计学家等]的语言、专业、文化背景,尽可能使其对CRF的理解趋于一致,从而得出可靠、一致的数据。必要时设计一份CRF完成指南供使用者参考。② 易于填写、便于录入。③ 适于统计分析,设计CRF时就考虑统计分析的要求,尽可能对数据项进行编码后收集,考虑编码的一贯性、合理性。
④ 便于存档与读取,如对于分次回收的就诊分册式CRF,在每页或每一回收单元的封面和/或书脊上有便于识别的标识符和分册名。⑤ 与方案和数据库保持一致。
3 CRF设计时点与流程?
CRF设计不是一项孤立的工作,与前后的方案设计和数据库设计密切相关,因此,方案、CRF与数据库的设计应大致同步,以便从不同的角度审视试验设计与数据管理,保证方案中有关数据收集的内容是合理而可行的,保证收集的数据正确地映射到用于统计分析的数据库中。CRF设计大致分以下6个步骤。
3.1 根据方案抽出数据项、收集时间、收集频率
3.1.1 抽出方案要求的数据项 即收集的主要目标是得出的安全性和有效性指标。避免收集无关数据,分散研究人员对关键变量的注意力而影响数据质量 ,增加试验成本和给受试者带来不便。
3.1.2 数据收集的时间 有些研究,特别是长期研究,有必要设定随访时间窗(time of window),如每半年随访1次,±1周内的随访数据都有效。时间窗外的数据也应被收集,但应事先明确如何标注这些数据,如何用于统计分析¨ 。
3.1.3 数据收集的频率 如体重(用于计算用药量的试验),是只收集1次,还是每次就诊收集,或是某几次就诊时收集。
3.2 探讨数据项收集的目的和可能性,给出数据项的定义、处理方法从方案中抽出所要收集的数据项及收集时间与频率后,还要与研究各方,如CRC以及I临床和统计学家共同探讨这些数据项被收集的目的、可能性与必要性。
3.2.1 目的确定数据项是用于统计分析,评价安全性与有效性的研究数据(research data);还用于试验过程的管理数据(administrative data),如材料分发到各试验中心的时间与数量、库存;或是提交药监部门,说明试验过程符合GCP等有关法规的数据(regulatory data),包括机构伦理委员会(IR审批方案或修正
案的批文号、参加研究人员的资格等数据。
3.2.2 收集的可能性 讨论收集的数据项给受试者、研究者和/或CRC以及申办者带来的精神、身体、工作量以及经济上的负担。
3.2.3 明确定义数据项和/或备选项 对不可直接理解的条目给出定义。包括诊断标准、检查方法、条件、不良事件分类依据等。例如,对“受试者是否患有高血压?”,应指明要求的血压范围、持续时间,与针对该病情必需的特殊干预措施。如有CRF完成指南,可在指南中作具体描述。
3.2.4 处理方法 讨论数据从发生的源头到被收集可能经历的处理过程,经过这一过程,数据的可靠性如何得到保证。如中央实验室检查项目从标本采集、预处理、运输、结果报告的过程。
3.3 CRF版面与项目设计
包括类型设计(电子CRF或书式、分册式CRF)、问题及其提示设计、数据格式设计、编码设计、版面布局设计等。
3.4 对照方案和数据库,检查一致性
收集数据项的内容、专用术语、诊断与评分标准的解释及数据项的编码与方案和数据库间的一致性检查,特别是三者之一有改动时,有其他两者做相应修改的规程。
3.5 CRF关联文件设计
3.5.1 预备与追踪CRF册/页 临床试验治疗期间非计划内的就诊,如发生不良事件,或在正常就诊时间窗内缺诊或有漏检项目,需要增加1次就诊时,要有预备CRF册/页,如就诊分册式CRF的预备册,书式CRF的预备页;发生不良事件,需要在完成
试验后继续追踪诊察,则使用追踪CRF册/页。预备CRF册/页罗列计划内就诊可能涉及的所有诊察项目;追踪CRF册/页则主要包括安全性指标项目,如生命体征、肝、肾功能等诊察项目。
3.5.2 CRF完成指南 CRF完成指南是对完成CRF的人员进行指导,也是监查员的主要参考资料,用于审查CRF中的数据。CRF完成指南有助于减少疑问,促进多中心间完成CRF的一致性,使得数据分析更加有意义。CRF完成指南有各种形式。书面CRF的完成指南可以是CRF的一部分(如针对某一格式说明,或
以对开页形式),或单独成文。既有总的完成指南,也有对每页完成的指导。而e—CRF可采用窗体、联机帮助系统,或在录入数据时跳出系统提示或对话框的形式提供指导。
3.5.3 Annotated CRF Annotated CRF指在CRF上标注数据库的文件名、表格名及字段名,将CRF上的空栏与数据集中相应的字段相映射,以便于数据读取者(主要是统计学家、数据管理员与药监部门工作人员)准确定位数据。目前大多采用手工标注,也可以采用电子化技术自动标注CRF,这样可提高易读性或复用率。目前,向美国FDA提交的电子数据要求有完整的PDF格式的Annotated CRF。
3.6 审查与批准
设计好的CRF及其关联文件(包括修正版本)要经过审查与批准过程,方可生效,以确保CRF和通过CRF收集的数据的质量。审查通常由研究项目组成员,包括主要研究者、监查员、数据管理者、统计学家及填写者(如CRC),从不同的视角对CRF及其关联文件进行审查,使得CRF满足不同成员的需求,增强CRF的可用性,提高数据质量,减少后期的数据清理程序。
4 CRF设计要点 刮
4.1 问题与提示的设计
问题与提示应当明确和清楚,以保证不同人群使用CRF得到完整且可进行比较的数据。设计要点:① 问句尽可能简短,不一定是完整句,只要足够清晰,短语也行¨ 。② 宜用肯定式问句,避免采用否定式问句,如用“受试者遵循指导了吗?”而不用
“受试者是否没能遵循指导?”,以免扰乱人的判断力。跨国的多中心临床试验,各国语言中的肯定与否定回答的习惯也不相同。③ 一次只问1个问题,不用引起混乱的复合问句,如“患者是否行动自由且饮食正常?”,应分为2个问题“患者是否行动自由?”和“饮食是否正常?”¨ 。④ 尽量避免对答案有诱导性的提问。
4.2 数据格式设计
数据格式主要有日期/时间型、数值型、文本型与自定义型。① 日期与时间格式。要清楚说明年、月、日的顺序,特别是跨国的多中心临床试验,如:_/— — (mm/dd/yyyy);时间格式要说明24 h制还是12 h制。② 数值格式。非整数要设计带有小数点与小数位数的固定格式,如体温:一一.一℃ ;有测量单位
的数据,最好事先设置好单位。如果机构问的测量单位可能不相同,应设计成允许填写不同的单位,或提供换算公式。③ 文本格式。文本数据很少用于统计分析,常用于监查员对数据的交叉核对,或对某些问题或数据做出说明。设计文本字段的长度要考虑所使用数据库对字段长度的限制;只要有可能,尽量用几个回答选项替代长文本数据。CRF设计尽可能少地采用文本格式,而以数值或编码格式收集数据。④ 自定义型。大多数数据在分
析或显示以前必须经过编码,因此尽可能以编码形式收集数据。自定义型数据即数据编码,一般为1~2位整数。
4.3 编码设计
编码格式可设计为选项列表或选项框。罗列所有可能的应答,进行编码。提问或提示应说明多个选项问是否相互排斥。如果不是,应指明是可接受1个以上的选择,还是只能选择1个答案。注意所有数据问编码的一致性和回答选项的顺序保持一致。如1=是,2=否,以及“无”,“不适用”,或“其他”的系列选项的次序不应有变化。对不能完全预测的答案,准备“其他,请详细说明”的选项,试验过程中对这一选项加以监控,如某一回答内容出现频率较高,可以对其进行追加编码,以便于统计分析。
4.4 版面布局设计
CRF版面的结构与页面设计应保持一致,既便于填写也便于录入。在决定CRF页面或屏幕组织形式时,应重视几个原则:① 按照试验流程排序。② CRF应是清晰可辨的。打印出的字体应足够大(至少是8号字体);填写栏、框的大小适宜,易于填写与辨认;以编码格式为选项框时,编码在选项框附近的位置(一般位于右下角)、大小既便于录入人员阅读又不影响填写人员的判断等。③ 数据项在页面上的布局应层次分明、赏心悦目。使用不同的字体、粗体字、斜体字、下划线、箭头可用于强调某些区域,但不可滥用,因为页面上有许多不同的格式,只会干扰使用者的注意力,辨不清究竟要注意什么。④ 回答区域与提问尽可能靠近,以避免填写时串行,同时兼顾录入人员的易读性,如使回答区域全部在页面左边或右边对齐排列。
4.5 其他设计上的注意点
4.5.1 区分不知道(unknown)/不适用(not applicable)/尚未得到(not
available)/未做(或未检测,notdone) 只要一个问题可能有一个或多个这些类型的回答,应为每一相关的类型设置一贯的编码或标记方法 。有时区分一项检查是未做还是在填写表格时结果尚未得到是重要的。如果未做检查,则不必要求提供缺失数据。然而,如果做了检查,尚未得到结果,则过段时间发疑问表,通常能取得遗漏的信息。如果是“不适用”,可规定用斜线划过该片记录区。
4.5.2 关联问题(referential questions)设置有一个或以上问题的回答(或不用回答)取决于某个其他问题的答案就称为关联问题。如:“受试者曾做过开心手术吗?”如果答是,请回答下一个问题“做过的手术名称?”这类问题建立了一种从属关系,要
求正确完成2个问题,否则整个系列就发生错误。但关联问题会带来一些问题,如:① CRF修订时,一个问题被删除了,而另一个问题还存在。② 对一个问题当有所补充时,从属的问题则未予考虑或未做相应修改。③ 同样的关联问题反复多次出现时,大
多数情况下从属的问题不用回答,当偶而需要回答时,填写人往往漏填或录入员忘记录入。因此,只有经过深思熟虑,才使用关联问题。不把一个问题和CRF后面较远部分的另一个问题相关联,并尽可能将这些问题清楚地集中归类,与其他问题或提示分
开,还可用箭头来连接需要回答的从属问题,以尽量减少错误 。
4.5.3 冗余(redundancy或duplication) 收集冗余数据常常用于交互核对来评估数据的有效性。但基于相同测量方法的数据多次收集,或在几个地点重复收***给研究机构造成不必要的工作负担;数据清理时,计算机逻辑检查出的不一致的清理需要耗费大量资源。如果确实需要用收集冗余数据来评估数据的有效性,应通过互不干扰的方法取得测量结果。例如,同一次就诊用不同样本(血清和尿)做2次妊娠试验,产生相同的结果则提示数据有效。同样如果要将几个数据合并产生一个合成的数据点,即基于原始数据的计算结果,应只收集原始数据而不是两者都收集 。机构问均数计算方法不同可能会导致数据的不一致 。如果方案要求研究者根据某一计算结果来决定下面的治疗,可以在CRF或原始病历页上设计一个区域,说明计算方法和填写栏,但这些数据不作为CRF收集的数据 。收集受试者标识符或姓名首字母之类的冗余数据则是非常有价值的,特别对于分册
式CRF,或CRF收集过程中可能单独收集的页,以便于数据正确地归于受试者名下。
5 结语
在临床试验中,CRF的重要性仅次于方案。CRF的设计,无论是书面CRF还是e—CRF的设计,属于CDM设计与计划阶段的一个程序步骤。因此,从CDM的角度出发考虑CRF的设计,不仅设计的CRF可用来获得正确、有效的数据,还能提高数据管理的其他程序步骤的效率,降低错误发生率。
[作者简介] 擎燕(1975一),女,博士研究生,主治医师。
联系电话:(025)86555033,E—mail:janepqy@ 126.COB。
第二篇:公司产品销售数据管理表格设计
美威科技产品销售数据统计表