利用 data.table 包导入数据,以 LUAD 为例
一般常规项包括submitter_id,vital_status,tumor_stage,pathologic_M,pathologic_N,pathologic_T,age_at_initial_pathologic_diagnosis,days_to_death,days_to_last_follow_up,race,gender
先看所选参数在 cl 的位置, table() 查看有几个level,有无缺失值
去掉lost follow up的样本
计算生存时间time
划分age_group
stage
T
N
M
save
对需要观测的临床特质值进行重新编码
去除不需要的临床信息
Vector of variables to summarize
Vector of categorical variables that need transformation
切割数据
最重要的三线表通常是以训练集和数据集来区分:group
Save to a CSV file
Save to a CSV file
event
stage
age
gender
T
N
M
save
载入数据
选择载入不同组数据分别进行cox分析
unicox
multicox
整合表格
以stage为例,其他参数一样做
致谢:生信技能树