最新文章專題視頻專題問答1問答10問答100問答1000問答2000關(guān)鍵字專題1關(guān)鍵字專題50關(guān)鍵字專題500關(guān)鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專題關(guān)鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當(dāng)前位置: 首頁 - 科技 - 知識百科 - 正文

數(shù)據(jù)預(yù)處理的四種方式

來源:懂視網(wǎng) 責(zé)編:小采 時間:2021-11-16 10:20:25
文檔

數(shù)據(jù)預(yù)處理的四種方式

1、數(shù)據(jù)清理,數(shù)據(jù)清理例程通過填寫缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離群點并解決不一致性來清理數(shù)據(jù)。主要是達到如下目標:格式標準化,異常數(shù)據(jù)清除,錯誤糾正,重復(fù)數(shù)據(jù)的清除。2、數(shù)據(jù)集成,數(shù)據(jù)集成例程將多個數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來。
推薦度:
導(dǎo)讀1、數(shù)據(jù)清理,數(shù)據(jù)清理例程通過填寫缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離群點并解決不一致性來清理數(shù)據(jù)。主要是達到如下目標:格式標準化,異常數(shù)據(jù)清除,錯誤糾正,重復(fù)數(shù)據(jù)的清除。2、數(shù)據(jù)集成,數(shù)據(jù)集成例程將多個數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來。

數(shù)據(jù)預(yù)處理的四種方式是:

  

  1、數(shù)據(jù)清理,數(shù)據(jù)清理例程通過填寫缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離群點并解決不一致性來“清理”數(shù)據(jù)。主要是達到如下目標:格式標準化,異常數(shù)據(jù)清除,錯誤糾正,重復(fù)數(shù)據(jù)的清除。

  

  2、數(shù)據(jù)集成,數(shù)據(jù)集成例程將多個數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來并統(tǒng)一存儲,建立數(shù)據(jù)倉庫的過程實際上就是數(shù)據(jù)集成。

  

  3、數(shù)據(jù)變換。通過平滑聚集,數(shù)據(jù)概化,規(guī)范化等方式將數(shù)據(jù)轉(zhuǎn)換成適用于數(shù)據(jù)挖掘的形式。

  

  4、數(shù)據(jù)歸約。數(shù)據(jù)挖掘時往往數(shù)據(jù)量非常大,在少量數(shù)據(jù)上進行挖掘分析需要很長的時間,數(shù)據(jù)歸約技術(shù)可以用來得到數(shù)據(jù)集的歸約表示,它小得多,但仍然接近于保持原數(shù)據(jù)的完整性,并結(jié)果與歸約前結(jié)果相同或幾乎相同。

  

  數(shù)據(jù)預(yù)處理(data preprocessing)是指在主要的處理以前對數(shù)據(jù)進行的一些處理。主要是清理異常值、糾正錯誤數(shù)據(jù)現(xiàn)實世界中數(shù)據(jù)大體上都是不完整,不一致的臟數(shù)據(jù),無法直接進行數(shù)據(jù)挖掘,或挖掘結(jié)果差強人意。為了提高數(shù)據(jù)挖掘的質(zhì)量產(chǎn)生了數(shù)據(jù)預(yù)處理技術(shù)。

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

數(shù)據(jù)預(yù)處理的四種方式

1、數(shù)據(jù)清理,數(shù)據(jù)清理例程通過填寫缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離群點并解決不一致性來清理數(shù)據(jù)。主要是達到如下目標:格式標準化,異常數(shù)據(jù)清除,錯誤糾正,重復(fù)數(shù)據(jù)的清除。2、數(shù)據(jù)集成,數(shù)據(jù)集成例程將多個數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來。
推薦度:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

專題
Top