2010年6月10日 星期四

CUDA加速數據探勘(Data Mining) - 機器"第六感"的實現


CUDA加速數據探勘(Data Mining)
Update on GPU-Accelerated Data Mining

數週前我們曾介紹過一種名叫Palo Suite的Jedox’s聯機分析處理運算法(Jedox’s OLAP, Jedox’s Online Analystical Processing)的工具. 在Steve Wildstrom這位技術編輯的部落格上介紹了更多關於Jedox’s聯機分析處理: “數據探勘(Data Mining)最初並未被發現它是非常適合採取平行運算的, 直到首次有數據探勘軟體開發者採用GPU圖形處理器進行高速平行運算, 並獲得令人激賞的運算效能, 這才發現GPU圖形處理器高速平行運算技術可以深入在龐大的數據資料庫中, 尋找並歸納有價值的資訊, 發揮數據探勘的真正價值.”

A few weeks ago we told you about Jedox’s Online Analytical Processing (OLAP) tools called Palo Suite. The Jedox offering is explored in more detail in a blog post by tech writer Steve Wildstrom, who says: "Data mining may not seem to be a natural fit for parallel processing. Yet at least one data mining software maker is scoring impressive performance gains using GPU processing for OLAP, a technique for taking a deep dive into a subset of what may be a very large database." See blog post here: http://blogs.nvidia.com/ntersect/2010/05/the-world-is-parallel-mining-data-on-gpus.html

OLAP數據探勘: 機器"第六感"的實現
http://office.microsoft.com/zh-tw/excel/HP101774371028.aspx
Online Analytical Processing (OLAP) 概觀
Online Analytical Processing (OLAP) 是一項技術,用來組織大型商務資料庫並且支援商務智慧。OLAP 資料庫會細分為一個或多個 Cube,而每一個 Cube 是由 Cube 管理員配合您擷取和分析資料的方式加以組織及設計,更方便您建立和使用需要的樞紐分析表以及樞紐分析圖報表。
何謂商務智慧?
商務分析師經常希望獲得商務的整體概念,以便根據彙總的資料看出更廣泛的趨勢,以及藉由各項變數看出這些趨勢的細節。商務智慧是一項流程,先從 OLAP 資料庫擷取資料,然後分析該資料以取得可用來進行商務決策與採取行動的資訊。例如,OLAP 和商務智慧能夠協助答覆下列類型的商務資料問題:
  • 如何從數以萬計的投資人中, 找出獲利最佳的投資模式? (最佳獲利: 時間的起/終點如何選擇) (投資: 哪些行為算投資? 定存算不算? 買樂透等高風險商品算投機還是投資?)
  • 如何比較 2007 年所有產品的總銷售額與 2006 年的總銷售額?
  • 如何比較目前獲利與過去五年同一時期的獲利?
  • 35 歲以上的客戶去年的消費額為多少,以及其消費行為如何隨
  • 時間演變?
  • 兩個特定國家/地區本月份相對於去年同月份的產品銷售量
  • 為何?
  • 每一個客戶年齡層群組按照產品類別的獲利分析為何 (同時包含利潤百分比與總額)?
  • 找出業績最高和最低的銷售人員、經銷商、零售商、用戶、
  • 夥伴或客戶。

沒有留言:

張貼留言