常用的數(shù)據(jù)預(yù)處理方法是:
1、墓于粗糙集理論的約簡方法。粗糙集理論是一種研究不精確、不確定性知識的數(shù)學(xué)工具。
2、基于概念樹的數(shù)據(jù)濃縮方法。在數(shù)據(jù)庫中,許多屬性都是可以進(jìn)行數(shù)據(jù)歸類,各屬性值和概念依據(jù)抽象程度不同可以構(gòu)成一個層次結(jié)構(gòu),概念的這種層次結(jié)構(gòu)通常稱為概念樹。
3、信息論思想和普化知識發(fā)現(xiàn)。特征知識和分類知識是普化知識的兩種主要形式,其算法基本上可以分為兩類:數(shù)據(jù)立方方法和面向?qū)傩詺w納方法。
4、基于統(tǒng)計分析的屬性選取方法??梢圆捎媒y(tǒng)計分析中的一些算法來進(jìn)行特征屬性的選取,比如主成分分析、逐步回歸分析、公共因素模型分析等。
5、遺傳算法。遺傳算法是一種基于生物進(jìn)化論和分子遺傳學(xué)的全局隨機搜索算法。遺傳算法的基本思想是:將問題的可能解按某種形式進(jìn)行編碼,形成染色體。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com