r語言怎樣分析excel中的數據
① 如何用r語言處理excel數據
把Excel數據保存為.csv格式,就可以直接用read.csv()讀取了;
如果要讀取.xls這樣的格式,要安裝相應的r包才能用。
② 如何才能拿R讀取Excel文件
R語言讀取excel文件文件其實有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安裝並載入讀取excel文件所用的包:
install.packages("xlsx") library(xlsx)
或者,
install.packages("readxl") library(readxl)
兩個包的基本介紹
xlsx是用R把excel文件中的工作表以data.frame的格式讀入R語言,他有兩個常用函數,其中read.xlsx2通常會比read.xlsx讀取的速度更快一些,因為它的好多工作是利用Java完成的,所以速度有所提升,但是在讀取子數據集的時候沒有read.xlsx穩定性好。
read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)
read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)
註:
sheetIndex:工作表單號
rowIndex:行號,就是你想讀取那些行
header:表頭,就是有沒有列名。比如姓名,年齡,學號等
startRow:比如你想從第五行開始讀取,就設置startRow = 5
readxl包可以用來讀取xls和xlsx格式的文件
read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)
註:
sheet:讀取的工作表
col_names: 如果是FALSE的話,就表示第一行不是列名,R會自動給你取成x1,x2...
colt_types: blank,numeric,date,text
na: 缺失值,默認空著的單元是缺失值,你也可以自己指定,比如認為999是缺失值