Loading...
|
Please use this identifier to cite or link to this item:
https://nccur.lib.nccu.edu.tw/handle/140.119/51202
|
Title: | 導入雲端運算概念於資料採礦之分類系統 Implement the concept of the cloud computing into the classification system of data mining |
Authors: | 林盈方 Lin, Ying Fang |
Contributors: | 鄭宇庭 蔡紋琦 謝邦昌 林盈方 Lin, Ying Fang |
Keywords: | 雲端運算 資料採礦 分類模型 cloud computing data mining classification models |
Date: | 2010 |
Issue Date: | 2011-10-05 14:31:57 (UTC+8) |
Abstract: | 近幾年來資料採礦及雲端運算的興起,導致許多公司企業紛紛推出有關雲端運算的服務,或利用資料採礦的技術以助於了解客戶行為。而資料採礦的技術不僅是企業所獨享的一個工具,一般非企業的使用者也常常會面臨到決策問題,為了讓一般使用者能夠方便取得軟體工具以及節省時間成本,本研究以雲端運算為概念,利用RExcel軟體和Excel VBA程式語言為研究工具,發展出一個資料採礦分類雲端運算系統。
本研究將欲分類的目標變數分為三種型態:數字連續型、數字類別型以及文字類別型,此分類系統會依照目標變數型態的不同,而採取不同的分類模型來分析使用者之資料,並分別以三個資料檔為例,上傳至此資料採礦之分類系統進行分析後,其分析結果報表將以網頁預覽的方式呈現給使用者,使用者可以針對連續型目標變數的資料分析結果,利用MAPE值評估分類模型之優劣,而類別型目標變數的資料分析結果,則可以正確率來評估分類模型之優劣。
使用者可透過簡易步驟來操作此系統,並選擇可解釋資料之最佳模型,也可從結果報表中獲取資料之特性,更進一步地可以進行所需的決策。
關鍵字:雲端運算、資料採礦、分類模型 In resent years, the rise of data mining and cloud computing has led many enterprises have been offering services related to cloud computing, or using data mining techniques to understand customer behaviors. Data mining is a tool not only for enterprises, but also for general non-business users who often face making decisions. In order to enable general users to easily assess the software and save time and costs, this study proposes a classification system of data mining constructed by RExcel and Excel VBA, which is based on cloud computing.
In this study, the target variable is divided into three types: digital continuous, digital categorical and literal categorical. The classification system is in accordance with the different types of target variables, taking different classification models to analyze user’s data. Taking three data as examples, respectively, uploading them to the system, then the analysis results will be present to the user in the way of page preview. The user can use MAPE values to evaluate classification models with regard to the results of the data for the continuous target variable, and use correct rate to evaluate classification models with regard to the results of the data for the categorical target variable.
Users can take simple steps to operate the system, select the best model which can explain the data, and obtain the characteristics of the data from the result reports, further to the necessary decision-making.
Keyword: cloud computing, data mining, classification models |
Reference: | 一、 中文文獻 1、 尹相志(2006),Microsoft SQL 2005資料採礦聖經,台北市:學貫行銷股份有限公司。 2、 何東隆、李美真(2002),Excel 2002 VBA與進階應用,台北市:文魁資訊。 3、 李至和(2006),爭搶e商機 特力屋 虛擬商城開張,經濟日報,A11版企業要聞。 4、 李開文(2008),雲端運算、格網運算與P2P運算(中)[電子版],2011年2月28日,取自台灣中等學校資訊管理人學會https://sites.google.com/a/tsima.org.tw/www/wiki/dian-zi-qi-kan/2008nian10yue-hao/yun-duan-yun-suan-ge-wang-yun-suan-yup2p-yun-suan-zhong#TOC-2。 5、 林東清(2003),資訊管理:e化企業的核心競爭能力(第四版),台北市:智勝文化事業有限公司。 6、 洪士吉(1999),操作輕鬆巨集通 : Excel VBA巨集逐步操作指引,台北市:旗標出版股份有限公司。 7、 洪嘉興(2003),資料挖掘(Data Mining)淺析,華控月刊,2003011,17-25。 8、 桂思強(1995),深造Excel VBA,台北市:博碩顧問。 9、 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2007),資料探勘Data Mining,台北市:旗標出版股份有限公司。 10、 雲端運算使用案例討論小組(2010),雲端運算使用案例白皮書(第三版)。 11、 鄒淑文(2010,3月19日),雲端平台:整合看不到的價值,聯合報經濟日報,電子通訊。 12、 蔡士源(2004),Excel VBA語法字典,台北市:文魁資訊。 13、 謝至恩(2008),服務在雲端,NMT第201期。 14、 謝邦昌、鄭宇庭、蘇志雄(2009),Data Mining概述-以Clementine12.0為例,新北市:中華資料採礦協會。 15、 曠文琪(2006),平價超級電腦正接手我們的生活,商業周刊第972期。 16、 瀨戶遙(2002),嗯!Excel VBA我也會PRO. 2000/2002對應,新北市:博碩文化。 17、 蘇芷萱(2011),中華電佈局智慧雲端產業 喊出今年通信業務成長10億元目標,2011年2月27日,取自華視新聞網網址。 http://news.cts.com.tw/cnyes/money/201101/201101110650346.html。 二、 英文文獻 1、 Breiman, L. (1984), Classification and regression trees, Wadsworth Internatonal Group. 2、 Breiman, L. (2001), Random Forests. Machine Learning, 45 (1): 5-32. 3、 Crawley, M. J. (2007), The R book. Chichester, West Sussex, England ; Hoboken, N.J.: Wiley. 4、 Fayyad, U., G. P. Shapiro and P. Smyth (1996), From Data Mining to Knowledge Discovery in Database. AI Magazine, 17, 37-54. 5、 Foster, I. and C. Kesselman (2004), The grid : blueprint for a new computing infrastructure. Elsevier Inc. 6、 Frawley, W. J., G. Gregory, P. S. Matheus and C. J. Matheus (1991), Knowledge Discovery in Databases: an Overview in Knowledge Discovery in Databases. Cambridge, MA: AAAI/MIT, 213-228. 7、 Frawley, W. J., S. G. Paitetsky and C. J. Matheus (1996), Knowledge Discovery in Databases: An Overview. Communications of the ACM, 39, 1-34. 8、 Heiberger, R. M. and N. Erich (2009), R Through Excel (1st ed.). New York : Springer. 9、 Han, J. and M. Kamber (2001), Data Mining: Concepts and Techniques. Simon Fraser University, Morgan Kaufmann Publishers. 10、 Hartigan, J. A. (1975), Clustering algorithms, New York: Wiley. 11、 Loh, W.Y. and Y. S. Shih (1997), Split selection methods for classification trees, Statistica Sinica, 7, 815-840. 12、 Maindonald, J. H. (2007), Data analysis and graphics using R : an example-based approach (2nd ed.). Cambridge, U.K. ; New York : Cambridge University Press. 13、 Mell, P. and T. Grance (2009), The NIST Definition of Cloud Computing [Electronic version]. National Institute of Standards and Technology, 53, 2-3. 14、 Quinlan, J. R. (1979), Discovering rules from large collections of examples: a case study. In Michie. Expert Systems in the Microelectronic Age. Edinburgh, Scotland: Edinburgh University Press. 15、 Ripley, B. D. (1996), Pattern recognition and neural networks, Cambridge University Press. 16、 Shannon, C. E. and W. Weaver (1949), The Mathematical Theory of Communication. University Illinois Press, Urbana. 17、 Usama, F., G. Gregory, P. S. Matheus and P. Smyth (1996), The KDD Process for Extracting Useful Knowledge from Volumes of Data, Communications of the ACM, 39(11), 27-34. 18、 Westphal, R. C. (1998), Data mining solutions : methods and tools for solving real-world problems, New York : John Wiley & Sons. 19、 Witten, I. H. and F. Eibe (2005), Data mining : practical machine learning tools and techniques, Amsterdam, The Netherlands ; Boston, Mass. 20、 Zhang, C. Q. and S. C. Zhang(2002), Association rule mining : models and algorithms, Berlin; New York : Springer. 三、 相關網站 1、 台灣雲端運算產業協會 http://www.twcloud.org.tw/Cloud/introduce4.do/。 2、 發展雲端技術應用 中華攜手趨勢領航新時代http://news.networkmagazine.com.tw/Construction/2010/04/01/18518/。 3、 Slesforce.com http://www.salesforce.com/tw/。 4、 TOP 500 SUPERCOMPUTER SITES http://www.top500.org/。 5、 iThome Online http://www.ithome.com.tw/itadm/channel.php?tab=1/。 6、 Cross Industry Standard Process for Data Mining http://www.crisp-dm.org/。 7、 The Data and Story Library http://lib.stat.cmu.edu/DASL/DataArchive.html/。 |
Description: | 碩士 國立政治大學 統計研究所 98354007 99 |
Source URI: | http://thesis.lib.nccu.edu.tw/record/#G0098354007 |
Data Type: | thesis |
Appears in Collections: | [統計學系] 學位論文
|
Files in This Item:
File |
Size | Format | |
400701.pdf | 3066Kb | Adobe PDF2 | 2865 | View/Open |
|
All items in 政大典藏 are protected by copyright, with all rights reserved.
|