pbootcms网站模板|日韩1区2区|织梦模板||网站源码|日韩1区2区|jquery建站特效-html5模板网

R語言 出現(xiàn)矩陣/缺失值的解決方案

這篇文章主要介紹了R語言 出現(xiàn)矩陣/缺失值的解決方案,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

缺失值處理一般包括三步:

1. 識別缺失數(shù)據(jù);

2. 檢查導(dǎo)致數(shù)據(jù)缺失的原因;

3. 刪除包含缺失值的實例或用合理的數(shù)值代替(插補)缺失值。

1.判斷缺失值

函數(shù)is.na()、is.nan()和is.infinite()可分別用來識別缺失值、不可能值和無窮值。每個返回結(jié)果都是

TRUE或FALSE

na表示缺失值

nan表示NOT A NUMBER

infinite表示+-Inf

一定要親手試x = 0/0,以及x = 1/0


>x <- NA
> is.na(x)
[1] TRUE
> is.nan(x)
[1] FALSE
> is.infinite(x)
 [1] FALSE

函數(shù)complete.cases()可用來識別矩陣或數(shù)據(jù)框中沒有缺失值的行

超級好用


#加載數(shù)據(jù)集
>data(sleep,package = "VIM")
#沒有缺失值的行
>sleep[complete.cases(sleep),]
#列出有一個或多個缺失值的行
>sleep[!complete.cases(sleep),]

2.圖形探究缺失數(shù)


#自己生成圖形
>library("VIM")
>aggr(sleep,prop = FALSE,numbers = TRUE)

matrixplot()函數(shù)可生成展示每個實例數(shù)據(jù)的圖形


#自己生成圖形
marginplot(sleep[c("Gest","Dream")],phc=c(20),col=c("darkgray","red","blue"))

3.刪除缺失值

函數(shù)complete.cases()可以用來存儲沒有缺失值的數(shù)據(jù)框或者矩陣形式的實例(行):


#可以把mydata替換成sleep,延續(xù)上面的代碼
>newdata <- mydata[complete.cases(mydata),]

同樣的結(jié)果可以用na.omit函數(shù)獲得:


#可以把mydata替換成sleep,延續(xù)上面的代碼
>newdata <- na.omit(mydata)

兩行代碼表示的意思都是:mydata中所有包含缺失數(shù)據(jù)的行都被刪除,然后結(jié)果才存儲到newdata中,以后擬合就用新數(shù)據(jù)newdata.

處理含缺失值的數(shù)據(jù)集時,成對刪除常作為行刪除的備選方法使用。對于成對刪除,觀測只是當(dāng)它含缺失數(shù)據(jù)的變量涉及某個特定分析時才會被刪除:


>cor(sleep,use = "pairwise.complete.obs")

3.1補全缺失值

函數(shù)mice()首先從一個包含缺失數(shù)據(jù)的數(shù)據(jù)框開始,然后返回一個包含多個(默認為5個)完整數(shù)據(jù)集的對象。

每個完整數(shù)據(jù)集都是通過對原始數(shù)據(jù)框中的缺失數(shù)據(jù)進行插補而生成的。

由于插補有隨機的成分,因此每個完整數(shù)據(jù)集都略有不同。

然后,with()函數(shù)可依次對每個完整數(shù)據(jù)集應(yīng)用統(tǒng)計模型(如線性模型或廣義線性模型),最 后 ,pool()函數(shù)將這些單獨的分析結(jié)果整合為一組結(jié)果。

最終模型的標(biāo)準(zhǔn)誤和p值都將準(zhǔn)確地反映出由于缺失值和多重插補而產(chǎn)生的不確定性。


>library(mice)
>data("sleep",package = "VIM")
>imp <- mice(sleep,seed = 1234)
#imp <- mice(sleep)
>fit <- with(imp,lm(Dream~Span+Gest))
fit
>pooled <- pool(fit)
>summary(pooled)
imp
>dataset2 <- complete(imp,action = 2)
>cor(sleep,use = "pairwise.complete.obs")

dataset2 is the newData

下圖為完整缺失值處理圖片:

補充:R語言讀取數(shù)據(jù)空值

一、Txt文件

1. 文件中的內(nèi)容有雙引號,空值的時候是一對雙引號

filename.txt 文件內(nèi)容形如:

"ID" "ITEM"

"1080254842" "漢字"

"1080254842" "中文"

"1080594798" ""

"1080594798" ""

導(dǎo)入數(shù)據(jù):


test <-read.table("filename.txt",header=TRUE)

空值部分并不是NA,R語言不會把他識別為NA,改為下面的語句,即可解決。


test <-read.table("filename.txt",header=TRUE,na.strings = "")

2. 文件中內(nèi)容無雙引號,空值即直接空白,形如下面:

ID ITEM

1080254842 漢字

1080254842 中文

1080594798

1080594798

導(dǎo)入數(shù)據(jù):


test <-read.table("filename.txt",header=TRUE)

會出現(xiàn)錯誤:Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :3行沒有2元素

第三行第二元素沒有。

修改為如下即可:


test <-read.table("filename.txt",header=TRUE,fill=TRUE)

導(dǎo)入數(shù)據(jù)成功,但是,空值仍然不是NA,還需加上na.strings = "",


test <-read.table("filename.txt",header=TRUE, fill=TRUE, na.strings = "")

成功導(dǎo)入。

二、csv文件


test <-read.csv("test.csv",header=TRUE,sep=",",na.strings = "")

其中:

header =TRUE,表示把第一行作為標(biāo)題。

sep=",",因為csv文件的列是用逗號分開的,加上sep=",",幫助R通過識別逗號來分割列。如果沒加,會出現(xiàn)原本多列數(shù)據(jù)導(dǎo)入后變?yōu)橐涣械那闆r。

na.strings = "":處理缺失值問題。

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持html5模板網(wǎng)。如有錯誤或未考慮完全的地方,望不吝賜教。

【網(wǎng)站聲明】本站部分內(nèi)容來源于互聯(lián)網(wǎng),旨在幫助大家更快的解決問題,如果有圖片或者內(nèi)容侵犯了您的權(quán)益,請聯(lián)系我們刪除處理,感謝您的支持!

相關(guān)文檔推薦

這篇文章主要介紹了R語言入門教程之刪除指定數(shù)據(jù)的方法,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
這篇文章主要介紹了R語言及其IDE(RStudio)下載安裝詳細流程,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
這篇文章主要給大家介紹了關(guān)于R語言數(shù)據(jù)可視化學(xué)習(xí)之圖形參數(shù)修改的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下
這篇文章主要給大家介紹了關(guān)于R語言利用plot()函數(shù)畫圖的基本用法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來
這篇文章主要介紹了R語言中對數(shù)據(jù)框的列名重命名的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)
這篇文章主要介紹了詳解R語言中的表達式、數(shù)學(xué)公式、特殊符號,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
主站蜘蛛池模板: ge超声波测厚仪-电动涂膜机-电动划格仪-上海洪富 | 对夹式止回阀_对夹式蝶形止回阀_对夹式软密封止回阀_超薄型止回阀_不锈钢底阀-温州上炬阀门科技有限公司 | 煤矿支护网片_矿用勾花菱形网_缝管式_管缝式锚杆-邯郸市永年区志涛工矿配件有限公司 | 上海公司注册-代理记账-招投标审计-上海昆仑扇财税咨询有限公司 上海冠顶工业设备有限公司-隧道炉,烘箱,UV固化机,涂装设备,高温炉,工业机器人生产厂家 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 双能x射线骨密度检测仪_dxa骨密度仪_双能x线骨密度仪_品牌厂家【品源医疗】 | 江苏皓越真空设备有限公司 | 压缩空气冷冻式干燥机_吸附式干燥机_吸干机_沪盛冷干机 | PVC地板|PVC塑胶地板|PVC地板厂家|地板胶|防静电地板-无锡腾方装饰材料有限公司-咨询热线:4008-798-128 | 高考志愿规划师_高考规划师_高考培训师_高报师_升学规划师_高考志愿规划师培训认证机构「向阳生涯」 | 杜康白酒加盟_杜康酒代理_杜康酒招商加盟官网_杜康酒厂加盟总代理—杜康酒神全国运营中心 | CPSE安博会| 数控专用机床,专用机床,自动线,组合机床,动力头,自动化加工生产线,江苏海鑫机床有限公司 | 硅PU球场、篮球场地面施工「水性、环保、弹性」硅PU材料生产厂家-广东中星体育公司 | 交联度测试仪-湿漏电流测试仪-双85恒温恒湿试验箱-常州市科迈实验仪器有限公司 | 冷凝锅炉_燃气锅炉_工业燃气锅炉改造厂家-北京科诺锅炉 | 冷却塔改造厂家_不锈钢冷却塔_玻璃钢冷却塔改造维修-广东特菱节能空调设备有限公司 | 校园文化空间设计-数字化|中医文化空间设计-党建|法治廉政主题文化空间施工-山东锐尚文化传播公司 | CE认证_产品欧盟ROHS-REACH检测机构-商通检测 | 深圳市源和塑胶电子有限公司-首页 | 卫生型双针压力表-高温防腐差压表-安徽康泰电气有限公司 | 废旧物资回收公司_广州废旧设备回收_报废设备物资回收-益美工厂设备回收公司 | 涂层测厚仪_光泽度仪_uv能量计_紫外辐照计_太阳膜测试仪_透光率仪-林上科技 | 电气控制系统集成商-PLC控制柜变频控制柜-非标自动化定制-电气控制柜成套-NIDEC CT变频器-威肯自动化控制 | 铝合金电阻-无源谐波滤波器-上海稳达电讯设备厂 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 薪动-人力资源公司-灵活用工薪资代发-费用结算-残保金优化-北京秒付科技有限公司 | 青岛代理记账_青岛李沧代理记账公司_青岛崂山代理记账一个月多少钱_青岛德辉财税事务所官网 | 佛山市钱丰金属不锈钢蜂窝板定制厂家|不锈钢装饰线条|不锈钢屏风| 电梯装饰板|不锈钢蜂窝板不锈钢工艺板材厂家佛山市钱丰金属制品有限公司 | 微型气泵-真空-蠕动-水泵-厂家-深圳市品亚科技有限公司 | 液晶拼接屏厂家_拼接屏品牌_拼接屏价格_监控大屏—北京维康 | 污水处理设备维修_污水处理工程改造_机械格栅_过滤设备_气浮设备_刮吸泥机_污泥浓缩罐_污水处理设备_污水处理工程-北京龙泉新禹科技有限公司 | 武汉刮刮奖_刮刮卡印刷厂_为企业提供门票印刷_武汉合格证印刷_现金劵代金券印刷制作 - 武汉泽雅印刷有限公司 | 【电子厂招聘_普工招工网_工厂招聘信息平台】-工立方打工网 | 座椅式升降机_无障碍升降平台_残疾人升降平台-南京明顺机械设备有限公司 | 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | CE认证_产品欧盟ROHS-REACH检测机构-商通检测 | 紧急泄压人孔_防爆阻火器_阻火呼吸阀[河北宏泽石化] | 卫生纸复卷机|抽纸机|卫生纸加工设备|做卫生纸机器|小型卫生纸加工需要什么设备|卫生纸机器设备多少钱一台|许昌恒源纸品机械有限公司 | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 | 钢板仓,大型钢板仓,钢板库,大型钢板库,粉煤灰钢板仓,螺旋钢板仓,螺旋卷板仓,骨料钢板仓 |