數(shù)據(jù)挖掘分析報告模板

學(xué)人智庫 時間:2018-02-08 我要投稿
【m.clearvueentertainment.com - 學(xué)人智庫】

  數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。下面是小編為大家整理的關(guān)于數(shù)據(jù)挖掘的分析報告模板,歡迎大家的閱讀。

  一、 提出問題

  1、單位基本情況及相關(guān)業(yè)務(wù)流程介紹;

  對于藥店,儲存大量的常用藥品是必不可少的工作,隨之而來的對藥品的數(shù)據(jù)信息管理和儲存成為了令人頭疼的問題,在接到貨源后,工作人員需要統(tǒng)計藥品產(chǎn)地和價格的信息,為以后的貨源供給地,用合理的價格出售藥物,是至關(guān)重要的工作。

  2、單位存在的問題。

  由于貨物種類、名稱眾多,在短時間內(nèi)分析好相關(guān)數(shù)據(jù)幾乎不可能,大量的數(shù)據(jù),依靠人力或是非數(shù)據(jù)統(tǒng)計軟件進(jìn)行統(tǒng)計工作,事倍功半。嚴(yán)重影響藥店的正常進(jìn)貨,出售藥品的工作。

  二、 分析問題

  1、對該單位存在的問題進(jìn)行分析;

  由以上問題可見,利用數(shù)據(jù)挖掘進(jìn)行相關(guān)數(shù)據(jù)的統(tǒng)計和整理工作,簡單、省時、有效。

  2、解決問題的可能途徑和方法。

  利用SQL SEVER 導(dǎo)入數(shù)據(jù),再提取統(tǒng)計分析結(jié)果,很快會得到想要的數(shù)據(jù)分析結(jié)果。

  三、 利用數(shù)據(jù)挖掘技術(shù)解決問題

  1、設(shè)計數(shù)據(jù)挖掘算法;

  決策樹;

  數(shù)據(jù)關(guān)聯(lián);

  神經(jīng)元算法;

  2、對挖掘結(jié)果進(jìn)行深入解釋和分析

  由此可以看見在不不同的產(chǎn)地,由于地理因素和特產(chǎn)藥品的原因,在藥品相關(guān)的植物盛產(chǎn)區(qū),進(jìn)貨比較便宜。

  可以分析出,不同的消費(fèi)人群對于同類的藥品的購買需求,對于同樣的功能的藥,藥存儲不同價格的種類,以滿足廣大消費(fèi)者的需求。

  可以分析以前的銷售結(jié)果,哪類、什么價格的更受消費(fèi)者歡迎,方便以后進(jìn)貨。

  四、 總結(jié)

  通過自己的實踐,對數(shù)據(jù)挖掘有了新的認(rèn)識。簡單來說,數(shù)據(jù)挖掘是基于“歸納”的思路,從大量的數(shù)據(jù)中(因為是基于歸納的思路,因此數(shù)據(jù)量的大小很大程度上決定了數(shù)據(jù)挖掘結(jié)果的魯棒性)尋找規(guī)律,為決策提供證據(jù)。從這種角度上來說,數(shù)據(jù)挖掘可能并不適合進(jìn)行科學(xué)研究,因為從本質(zhì)上來說,數(shù)據(jù)挖掘這個技術(shù)是不能證明因果的,以一個最典型的例子來說,例如數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)啤酒銷量和尿布之間的關(guān)系,但是顯然這兩者之間緊密相關(guān)的關(guān)系可能在理論層面并沒有多大的意義。不過,僅以此來否定數(shù)據(jù)挖掘的意義,顯然就是對數(shù)據(jù)挖掘這項技術(shù)價值加大的抹殺,顯然,數(shù)據(jù)挖掘這項技術(shù)從設(shè)計出現(xiàn)之初,就不是為了指導(dǎo)或支持理論研究的,它的重要意義在于,它在應(yīng)用領(lǐng)域體現(xiàn)出了極大地優(yōu)越性。一下是我參閱資料總結(jié)的設(shè)計數(shù)據(jù)挖掘的步驟:

 、 理解數(shù)據(jù)和數(shù)據(jù)的來源

  ② 獲取相關(guān)知識與技術(shù)

 、 整合與檢查數(shù)據(jù)

 、 去除錯誤或不一致的數(shù)據(jù)。

 、菁僭O(shè)數(shù)據(jù)模型。

 、 實際數(shù)據(jù)挖掘工作(data mining)。

  ⑦ 測試和驗證挖掘結(jié)果(testing and verfication)。

 、 解釋和應(yīng)用(interpretation and use)。

  由上述步驟可看出,數(shù)據(jù)挖掘牽涉了大量的準(zhǔn)備工作與規(guī)劃工作,事實上許多專家都認(rèn)為整套數(shù)據(jù)挖掘的過程中,有80%的時間和精力是花費(fèi)在數(shù)據(jù)預(yù)處理階段,其中包括數(shù)據(jù)的凈化、數(shù)據(jù)格式轉(zhuǎn)換、變量整合,以及數(shù)據(jù)表的鏈接?梢姡谶M(jìn)行數(shù)據(jù)挖掘技術(shù)的分析之前,還有許多準(zhǔn)備工作要完成。

[數(shù)據(jù)挖掘分析報告模板]