下載地址:
https://www.yanxishe.com/resourceDetail/1564?from=leiphonecolumn_res0525
數據挖掘一般是指從大量的數據中通過算法搜索隱藏於其中信息的過程。大多數數據挖掘的教材都專注於介紹理論基礎,因而往往難以理解和學習。
本書是寫給程序員的一本數據挖掘指南,可以幫助讀者動手實踐數據挖掘、集體智慧並構建推薦系統。全書共8章,介紹了數據挖掘的基本知識和理論、協同過濾、內容過濾及分類、算法評估、樸素貝葉斯、非結構化文本分類以及聚類等內容。本書採用“在實踐中學習”的方式,用生動的圖示、大量的表格、簡明的公式、實用的Python代碼示例,闡釋數據挖掘的知識和技能。每章還給出了習題和練習,幫助讀者鞏固所學的知識。
本書適合對數據挖掘、數據分析和推薦系統感興趣的程序員及相關領域的從業者閲讀參考;同時,本書也可以作為一本輕鬆有趣的數據挖掘課程教學參考書。
Ron Zacharski是一名軟件開發工程師,曾在威斯康辛大學獲美術學士學位,之後還在明尼蘇達大學獲得了計算機科學博士學位。博士後期間,他在愛丁堡大學研究語言學。正是基於廣博的學識,他不僅在新墨西哥州立大學的計算研究實驗室工作,期間還接觸過自然語言處理相關的項目,而該實驗室曾被《連線》雜誌評為機器翻譯研究領域翹楚。除此之外,他還曾教授計算機科學、語言學、音樂等課程,是一名博學多才的科技達人。
王斌 博士,中國科學院信息工程研究所研究員,博士生導師,中國科學院大學兼職教授,研究方向為信息檢索、自然語言處理與數據挖掘。主持國家973、863、國家自然科學基金、國際合作基金、部委及企業合作等課題近30項,發表學術論文130餘篇,領導研製的多個系統上線使用,曾獲國家科技進步二等獎和北京市科學技術二等獎各一項。現為中國中文信息學會理事、信息檢索、社會媒體處理、語言與知識計算等多個專業委員會委員、《中文信息學報》編委、中國計算機學會高級會員及中文信息處理專業委員會委員。多次擔任SIGIR、ACL、CIKM等會議的程序委員會委員。《信息檢索導論》、《大數據:互聯網大規模數據挖掘與分佈式處理》、《機器學習實戰》、《Mahout實戰》譯者。2006年起在中國科學院大學講授《現代信息檢索》研究生課程,累計選課人數已超過1500人。迄今培養博士、碩士研究生近40名。
AI 研習社已經和阿里大文娛、曠視、搜狗搜索、小米等知名公司達成聯繫,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 後台,準備了一些內推渠道羣。
歡迎大家添加研習社小學妹微信(aiyanxishe),小學妹拉你加入(備註求職)。
雷鋒網雷鋒網雷鋒網