<cite id="yyiou"><tbody id="yyiou"></tbody></cite>
<cite id="yyiou"><samp id="yyiou"></samp></cite>
  • <s id="yyiou"></s><bdo id="yyiou"><optgroup id="yyiou"></optgroup></bdo>
  • <cite id="yyiou"><tbody id="yyiou"></tbody></cite>

    首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電信技術 > 數據采集與處理 > 大數據隨機樣本劃分模型及相關分析計算技術 【正文】

    大數據隨機樣本劃分模型及相關分析計算技術

    黃哲學; 何玉林; 魏丞昊; 張曉亮 深圳大學計算機與軟件學院大數據技術與應用研究所; 深圳518060; 深圳大學大數據系統計算技術國家工程實驗室; 深圳518060
    • 大數據
    • 隨機樣本劃分
    • 漸近式集成學習
    • 人工智能

    摘要:設計了一種新的適用于大數據的管理和分析模型大數據隨機樣本劃分(Random samplepartition,RSP)模型,它是將大數據文件表達成一系列RSP數據塊文件的集合,分布存儲在集群節點上。RSP的生成操作使每個RSP數據塊的分布與大數據的分布保持統計意義上的一致,因此,每個RSP數據塊是大數據的一個隨機樣本數據,可以用來估計大數據的統計特征,或建立大數據的分類和回歸模型。基于RSP模型,大數據的分析任務可以通過對RSP數據塊的分析來完成,不需要對整個大數據進行計算,極大地減少了計算量,降低了對計算資源的要求,提高了集群系統的計算能力和擴展能力。本文首先給出RSP模型的定義、理論基礎和生成方法;然后介紹基于RSP數據塊的漸近式集成學習Alpha計算框架;之后討論基于RSP模型和Alpha框架的大數據分析相關計算技術,包括:數據探索與清洗、概率密度函數估計、有監督子空間學習、半監督集成學習、聚類集成和異常點檢測;最后討論RSP模型在分而治之大數據分析和抽樣方法上的創新,以及RSP模型和Alpha計算框架實現大規模數據分析的優勢。

    注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

    投稿咨詢 免費咨詢 雜志訂閱

    我們提供的服務

    服務流程: 確定期刊 支付定金 完成服務 支付尾款 在線咨詢
    主站蜘蛛池模板: 同仁县| 湾仔区| 郓城县| 北流市| 高阳县| 义马市| 民县| 北流市| 土默特左旗| 盐池县| 玉树县| 洞口县| 津市市| 紫阳县| 县级市| 清流县| 辉县市| 重庆市| 常德市| 桃源县| 广德县| 安徽省| 汨罗市| 桐庐县| 章丘市| 饶阳县| 吉林省| 沐川县| 津市市| 娱乐| 鸡泽县| 汾阳市| 永新县| 阿克苏市| 芮城县| 西城区| 四平市| 马鞍山市| 隆安县| 广灵县| 若尔盖县|