n'n'n

 原始数据和目标数据如图所示。要达到目标格式,需要以下步骤:设原始数据为df,整理数据为a

1:去除不需要的行和列,第一行,第二行和第四行,第二列

df <- df[-(1:2),] df <- df[-2,] df <-df[,-2]

2:第一列作为行名,第一行作为列名

colnames(df) <- df[1,] df <- df[-1,] rownames(df) <- df$`Cell line cosmic identifiers`

注意不能直接使用rownames(df) <- df[,1],因为tibble上设置行名已经不推荐使用了。并且不能直接删除df的第一列,否则新设置的行名和第一列都会被删除。

3:对列名进行操作。加上“COSMIC_”,然后删掉df的第一行即可。

df <- df%>%t()%>%as.data.frame colnames(df) <- paste0("COSMIC_",colnames(df)) df <- df[-1,]

paste0函数用来连接字符串。

paste0和paste的区别如下:

paste()函数需要使用sep参数指定字符向量之间的分隔符,默认分隔符是一个空格。例如,paste("a", "b", "c", sep = "-")返回的是字符串"a-b-c"。paste0()函数是paste()函数的简写,它默认的分隔符是空字符,即没有分隔符。例如,paste0("a", "b", "c")返回的是字符串"abc"。

查看原文