專題文章
時(shí)長(zhǎng):00:00更新時(shí)間:2020-11-09 12:59:15
如何拓展Hadoop的InputFormat為其他分隔符:在Hadoop中,常用的TextInputFormat是以換行符作為Record分隔符的。 在實(shí)際應(yīng)用中,我們經(jīng)常會(huì)出現(xiàn)一條Record中包含多行的情況,例如: doc..../doc 此時(shí),需要拓展TextInputFormat以完成這個(gè)功能。 先來(lái)看一下原始實(shí)現(xiàn): public class Tex
查看詳情