摘要:特征演化的數據流 數據流學習是近年來機器學習與數據挖掘領域的一個熱門的研究方向,數據流的場景和靜態數據集的場景最大的一個特點就是數據會發生演化,關于演化數據流的研究大多集中于概念漂移檢測(有監督學習),概念/聚類演化分析(無監督學習),然而,人們往往忽略了一個經常出現的演化場景:特征演化。大多數研究 閱讀全文
posted @ 2019-11-22 15:56 PJQOOO 閱讀 (147) 評論 (0) 編輯
摘要:Clustering 聚類 密度聚類——DBSCAN 前面我們已經介紹了兩種聚類算法:k-means和譜聚類。今天,我們來介紹一種基于密度的聚類算法——DBSCAN,它是最經典的密度聚類算法,是很多算法的基礎,擁有很多聚類算法不具有的優勢。今天,小編就帶你理解密度聚類算法DBSCAN的實質。 DBS 閱讀全文
posted @ 2019-11-14 10:03 PJQOOO 閱讀 (1009) 評論 (0) 編輯
摘要:Clustering 聚類 譜聚類 上文我們引入了是聚類,并介紹了第一種聚類算法K-means。今天,我們來介紹一種流行的聚類算法——譜聚類(Spectral Clustering),它的實現簡單,而且效果往往好于傳統的聚類算法,如k-means,但是其背后的原理涉及了很多重要而復雜的知識,如圖論, 閱讀全文
posted @ 2019-11-12 08:52 PJQOOO 閱讀 (263) 評論 (1) 編輯
摘要:Clustering 聚類K-means 聚類是機器學習和數據挖掘領域的主要研究方向之一,它是一種無監督學習算法,小編研究生時期的主要研究方向是“數據流自適應聚類算法”,所以對聚類算法有比較深刻的理解,于是決定開一個專題來寫聚類算法,希望可以為入門及研究聚類相關算法的讀者帶來幫助。聚類可以作為一個單 閱讀全文
posted @ 2019-11-09 14:07 PJQOOO 閱讀 (160) 評論 (0) 編輯
摘要:半監督支持向量機(S3VMs) 今天我們主要介紹SVM分類器以及它的半監督形式S3VM,到這里我們關于半監督學習基礎算法的介紹暫時告一段落了。之后小編還會以論文分享的形式介紹一些比較新的半監督學習算法。讓我們開始今天的學習吧~ 引入 支持向量機(SVM)相信大家并不陌生吧?但是如果數據集中有大量無標 閱讀全文
posted @ 2019-11-01 08:54 PJQOOO 閱讀 (609) 評論 (0) 編輯
摘要:基于圖的半監督學習 以一個無標簽數據的例子作為墊腳石 Alice正在翻閱一本《Sky and Earth》的雜志,里面是關于天文學和旅行的文章。Alice不會英文,她只能通過文章中的圖片來猜測文章的類別。比如第一個故事是“Bridge Asteroid”有一張多坑的小行星圖片,那么它很明顯是天文學類 閱讀全文
posted @ 2019-10-31 09:16 PJQOOO 閱讀 (1447) 評論 (1) 編輯
摘要:Semi-Supervised Learning 半監督學習(三) 方法介紹 Mixture Models & EM 無標簽數據告訴我們所有類的實例混和在一起是如何分布的,如果我們知道每個類中的樣本是如何分布的,我們就能把混合模型分解成獨立的類,這就是mixture models背后的機制。今天,小 閱讀全文
posted @ 2019-10-27 08:28 PJQOOO 閱讀 (398) 評論 (0) 編輯
摘要:循環神經網絡導讀 循環神經網絡(Recurrent Neural Network)是一類以序列數據為輸入,在序列的演進方向進行遞歸且所有節點(循環單元)按鏈式連接的遞歸神經網絡。其中雙向循環神經網絡(Bidirectional RNN, Bi-RNN)和長短期記憶網絡(Long Short-Term 閱讀全文
posted @ 2019-10-25 08:42 PJQOOO 閱讀 (173) 評論 (0) 編輯
摘要:Semi-Supervised Learning 半監督學習(二) 介紹 在上篇文章中我們介紹了關于統計機器學習和半監督學習的一些基本概念。在這篇文章中,我們仍著重帶讀者更深入地了解半監督學習基礎,了解半監督學習的常用方法,模型假設,并且通過實例帶讀者去理解半監督學習的過程。難度依然較基礎,但是相信 閱讀全文
posted @ 2019-10-24 10:07 PJQOOO 閱讀 (897) 評論 (0) 編輯
摘要:Semi-Supervised Learning 半監督學習(一) 入門級介紹 傳統的機器學習任務分為無監督學習(數據無標簽,如,聚類,異常檢測等)和監督學習(數據有標簽,如,分類,回歸等)。半監督學習針對的是只有部分數據有標簽的學習任務,而其中有標簽數據往往遠遠小于無標簽數據。它是機器學習領域研究 閱讀全文
posted @ 2019-10-23 10:32 PJQOOO 閱讀 (806) 評論 (0) 編輯
摘要:在使用Word編寫文章時,總會遇到書寫數學公式的情況。使用Word的公式輸入工具需要頻繁地使用鼠標,因而編寫公式會顯得繁瑣麻煩,那么有什么辦法可以優雅地在Word中書寫公式呢?其實Word早在Word 2007中就提供了像Latex一樣使用代碼書寫公式的特性。詳情可見Linear format eq 閱讀全文
posted @ 2019-10-16 10:32 PJQOOO 閱讀 (260) 評論 (0) 編輯
摘要:排序算法進階 上篇文章中我們主要介紹了經典的八大排序算法,從算法思想,動圖演示,代碼實現,復雜度及穩定性分析等角度進行學習。還沒閱讀的童鞋可以點這里進行瀏覽。 求知若渴的你肯定不會滿足于入門的內容,今天,小編在上一篇的基礎上,對多種排序算法進行優化,讓我們一起來康康吧~~ 01冒泡排序 1. 優化一 閱讀全文
posted @ 2019-10-15 08:51 PJQOOO 閱讀 (209) 評論 (0) 編輯
摘要:排序算法入門 在我們初學算法的時候,最先接觸到的就是排序算法,這些排序算法應用十分廣泛,而且是很多算法的基礎,可以說是每個程序員都必須得掌握的了。今天小編就來帶你一舉拿下經典的八大排序算法,每種算法都會有算法思想描述,動圖演示,代碼實現,復雜度及穩定性分析等。 01冒泡排序 1. 原理 假如我們要將 閱讀全文
posted @ 2019-10-14 08:45 PJQOOO 閱讀 (548) 評論 (0) 編輯
摘要:劍指offer題解(Java版) 從尾到頭打印鏈表 題目描述 輸入一個鏈表,按從尾到頭的順序返回一個ArrayList。 方法1:用一個棧保存從頭到尾訪問鏈表的每個結點的值,然后按出棧順序將各個值存入ArrayList中; 方法2:逆序打印1 2 3,可以先逆序打印2 3,最后再打印第一個結點1。 閱讀全文
posted @ 2019-09-05 09:23 PJQOOO 閱讀 (53) 評論 (0) 編輯
摘要:一. 先聊點別的 1. sql & nosql sql指關系型數據庫,如Oracle,MySQL等,nosql泛指非關系型數據庫,如MongoDB,Redis等;SQL數據存在特定結構的表中,而NoSQL則更加靈活和可擴展,存儲方式可以是JSON文檔,哈希表或其他方式;在sql中必須定義好表和字段結 閱讀全文
posted @ 2019-08-18 14:05 PJQOOO 閱讀 (47) 評論 (0) 編輯
摘要:《高性能MySQL》讀書筆記 一. 索引的優點 1. 索引可以讓服務器快速定位到表的指定位置,大大減少了服務器需要掃描的數量; 2. 最常見的B-Tree索引按照順序存儲數據,可以用來做order by和group by操作幫助服務器避免排序和臨時表; 3. 可以將隨機I/O變為順序I/O; 二. 閱讀全文
posted @ 2019-08-08 09:09 PJQOOO 閱讀 (105) 評論 (0) 編輯
摘要:1. minimum-depth-of-binary-tree 題目描述 Given a binary tree, find its minimum depth.The minimum depth is the number of nodes along the shortest path from 閱讀全文
posted @ 2019-06-05 11:36 PJQOOO 閱讀 (101) 評論 (0) 編輯
摘要:1. 單例模式(在內存之中永遠只有一個對象) 1.1 多線程安全單例模式——不使用同步鎖 上述代碼中的一個缺點是該類加載的時候就會直接new 一個靜態對象出來,當系統中這樣的類較多時,會使得啟動速度變慢 ?,F在流行的設計都是講“延遲加載”,我們可以在第一次使用的時候才初始化第一個該類對象。所以這種適 閱讀全文
posted @ 2019-05-27 22:16 PJQOOO 閱讀 (149) 評論 (0) 編輯
摘要:本篇文章主要是總結Java多線程/高并發編程的知識點,由淺入深,僅作自己的學習筆記,部分侵刪。 一 . 基礎知識點 1. 進程于線程的概念 2.線程創建的兩種方式 注:public void run()方法提供了線程實際工作的代碼; 繼承Thread類的方法存在單繼承的缺陷; Runnable的代碼 閱讀全文
posted @ 2019-05-27 07:33 PJQOOO 閱讀 (1350) 評論 (0) 編輯
摘要:好文!http://blog.csdn.net/v_july_v/article/details/7624837 閱讀全文
posted @ 2017-07-16 15:12 PJQOOO 閱讀 (94) 評論 (2) 編輯
摘要:注:此博文只是自己總結的筆記,參考很很多大牛的博客。 決策樹算法之ID3算法 1.奧卡姆剃刀: 若有多個假設和觀察值一致,則選擇簡單的那個。(be simple) 2.算法核心思想: 期望信息越小,信息增益越大,從而純度越高。ID3算法以信息增益為度量選擇,選擇分裂后信息增益最大的屬性進行分裂。所以 閱讀全文
posted @ 2017-07-16 14:23 PJQOOO 閱讀 (126) 評論 (0) 編輯
摘要:梯度下降法 ? 下面的h(x)是要擬合的函數,J(θ)損失函數,theta是參數,要迭代求解的值,theta求解出來了那最終要擬合的函數h(θ)就出來了。其中m是訓練集的記錄條數,j是參數的個數。 梯度下降法流程: (1)先對θ隨機賦值,可以是一個全零的向量。 (2)改變θ的值,使J(θ)按梯度下降 閱讀全文
posted @ 2017-07-16 14:20 PJQOOO 閱讀 (157) 評論 (0) 編輯
摘要:第一章.方法概論 <! more 1.監督學習:對任意給定輸入,對其相應的輸出做一個好的預測。 2.回歸問題:輸入變量與輸出變量都為連續變量的預測問題。 ? 分類問題:輸入變量為有限個離散變量的預測問題。 ? 標注問題:輸入輸出變量均為變量序列的預測問題。 3.概率模型: 由條件概率分布P(Y|X) 閱讀全文
posted @ 2017-07-16 14:18 PJQOOO 閱讀 (235) 評論 (0) 編輯
摘要:HiBench資源及教程:https://github.com/intel-hadoop/HiBench 介紹: Hadoop新人 環境 linux 該筆記針對英語弱雞&自己在使用過程用遇到的問題的記錄。 步驟: 首先創建一個文件夾HiBench:mkdir HiBench cd HiBench g 閱讀全文
posted @ 2017-05-24 17:18 PJQOOO 閱讀 (4528) 評論 (1) 編輯
摘要:Hdu 5385The path 題目鏈接:http://acm.hdu.edu.cn/showproblem.php?pid=5385 題意:有一個聯通的有向圖,d(x)用來記錄從1點到x點的最短路徑長度,d(1)=0;一個圖可以稱之為好圖是存在一個x使得d(1)d(x+1)>...d(n),... 閱讀全文
posted @ 2015-08-17 17:09 PJQOOO 閱讀 (133) 評論 (0) 編輯
ag二分彩