亚洲精品黄免费在线观看,久久久久久综合精品视频,亚洲日本人在线看片,亚洲欧美中文日韩v日本

<menu id="ttppp"></menu>
<pre id="ttppp"></pre><small id="ttppp"></small><address id="ttppp"></address>

      <td id="ttppp"></td>

      1. 當(dāng)前位置: 首頁>> 輿情簡(jiǎn)評(píng) >>正文

        機(jī)器學(xué)習(xí)算法-k均值聚類

        2020-02-26 10:44 作者:蟻坊軟件研究院 瀏覽次數(shù):7519 標(biāo)簽: 深度學(xué)習(xí)算法
        "速讀全網(wǎng)"輿情,了解傳播路徑,把握發(fā)展態(tài)勢(shì)——點(diǎn)擊試用鷹眼速讀網(wǎng)全網(wǎng)輿情監(jiān)測(cè)分析系統(tǒng)

        k均值聚類算法,是一種無監(jiān)督算法,該算法的主要作用是將相似的樣本自動(dòng)歸到一個(gè)類別中。所謂的無監(jiān)督算法,就是輸入樣本沒有對(duì)應(yīng)的輸出或標(biāo)簽,而聚類試圖將數(shù)據(jù)集中的樣本劃分為若干個(gè)通常是不相交的子集,每個(gè)子集稱為一個(gè)簇。k均值聚類簡(jiǎn)單易懂而且非常有效,但是確定合理的k值和k個(gè)初始類簇中心點(diǎn)對(duì)于聚類效果的好壞有很大的影響。

        0 k均值聚類算法的主要學(xué)習(xí)內(nèi)容

        1)基本原理

        2)k的選擇及初始質(zhì)心

        3)k均值的優(yōu)缺點(diǎn)

        1  k均值聚類的基本原理

        1.1  k均值聚類算法描述

        k均值聚類算法中的一種,其中k表示類別數(shù),是一種通過均值對(duì)數(shù)據(jù)點(diǎn)進(jìn)行聚類的算法。適用于大樣本,但需要事先指定分為k個(gè)類。

        原理:從n個(gè)數(shù)據(jù)對(duì)象任意選擇k個(gè)對(duì)象作為初始聚類中心,對(duì)剩余的其他對(duì)象,則根據(jù)它們與k個(gè)聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;再計(jì)算每個(gè)所獲的新的聚類中心(該聚類中所有對(duì)象的均值);不斷重復(fù)這一過程,知道標(biāo)準(zhǔn)測(cè)度函數(shù)開始收斂為止。

        k均值聚類的特點(diǎn):各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。

        1.2 k均值算法步驟

        2 k值和初始質(zhì)心的選取

        2.1 k值的選取

        對(duì)于一個(gè)給定沒有分類的數(shù)據(jù)集,最后具體應(yīng)該分為多少類,這確實(shí)時(shí)一個(gè)讓人頭痛的問題。要使k均值最后分類結(jié)果最好,也就是要使k均值最小化,是要最小化所有的數(shù)據(jù)點(diǎn)與其所關(guān)聯(lián)的聚類中心點(diǎn)之間的距離之和,因此,我們可以設(shè)計(jì)k均值的代價(jià)函數(shù)為:

        而k值在這里取到了重要作用。據(jù)統(tǒng)計(jì)發(fā)現(xiàn)k值的增加,其數(shù)據(jù)的代價(jià)損失是不斷變小,如圖,我們發(fā)現(xiàn)在k=3時(shí),代價(jià)函數(shù)隨著k值變化的幅度顯著降低,在k>3之后所帶來的作用也沒有特別明顯,所以我們可以選擇k=3作為我們的聚類數(shù)目。

        但實(shí)際應(yīng)用中,k值的變換規(guī)律都不是和上圖一樣存在突變點(diǎn),即拐點(diǎn)。那么這時(shí),k值的選擇主要還是根據(jù)經(jīng)驗(yàn)以及利用k均值聚類的目的來決定。

        2.2聚類中心的初始化

        一般,在實(shí)際應(yīng)用中,我們都是采取隨機(jī)產(chǎn)生k個(gè)點(diǎn)作為初始的聚類中心,其原因是,簡(jiǎn)單快捷。

        但k個(gè)初始化的質(zhì)心的位置選擇對(duì)最后的聚類結(jié)果和運(yùn)行時(shí)間都有很大的影響,因此需要選擇合適的k個(gè)質(zhì)心。如果僅僅是完全隨機(jī)的選擇,有可能導(dǎo)致算法收斂很慢。k-means++算法就是對(duì)k均值隨機(jī)初始化質(zhì)心方法的優(yōu)化。

        k-means++算法對(duì)于初始化質(zhì)心的優(yōu)化策略也很簡(jiǎn)單,如下:

        k均值聚類算法舉例說明:

        以下是一組用戶的年齡數(shù)據(jù)

        我們將K值定義為2對(duì)用戶進(jìn)行聚類,并隨機(jī)選擇16和22作為兩個(gè)類別的初始質(zhì)心。

        計(jì)算距離并劃分?jǐn)?shù)據(jù)

        我們以圖的形式展示聚類的過程,在這組年齡數(shù)據(jù)中,我們選擇16和22作為兩個(gè)類別的初始質(zhì)心,并通過計(jì)算所有用戶的年齡值與初始質(zhì)心的距離對(duì)用戶進(jìn)行第一次分類。

        通過計(jì)算每個(gè)用戶年齡分別與兩個(gè)初始質(zhì)心的距離,這里我們以黑色實(shí)心圓點(diǎn)表示兩者距離較大,如表2.2.3,第一個(gè)數(shù)據(jù)15,到初始初始質(zhì)心點(diǎn)16的距離為1,到第二個(gè)初始質(zhì)心22的距離為7,相比之下,15與16的距離更近,近的距離以空心圓點(diǎn)標(biāo)記。因此15這個(gè)年齡被劃分到質(zhì)心點(diǎn)為16的一組中,如果年齡數(shù)據(jù)點(diǎn)到兩個(gè)初始質(zhì)心的距離相等時(shí),可任意劃分到這兩組中,例如,數(shù)據(jù)19到16和22的距離都為3,在這里,我們將它劃分到了22中。

        上表,我們按歐式距離最小,即相似程度最高對(duì)數(shù)據(jù)分為組后,分別計(jì)算分組中數(shù)據(jù)的均值,得分別為15.33和36.25,并以這兩個(gè)均值作為新的質(zhì)心。用新的質(zhì)心代替原有的初始質(zhì)心,迭代計(jì)算每個(gè)年齡數(shù)據(jù)點(diǎn)到新質(zhì)心的距離,直到新的質(zhì)心和上一次的質(zhì)心相同為止。

        表2.2.4,以年齡數(shù)據(jù)點(diǎn)到新質(zhì)心的距離值完成分組后,計(jì)算兩組的均值,為18.56和45.9,年齡數(shù)據(jù)點(diǎn)22到18.56的距離為3.44,到45.9的距離為23.9。因此年齡數(shù)據(jù)點(diǎn)22分配到質(zhì)心為18.56的分組中。

        這兩個(gè)均值與上一次的質(zhì)心結(jié)果不一樣,故又用新得到的均值代替原來的質(zhì)心。在新的質(zhì)心下,計(jì)算數(shù)據(jù)點(diǎn)到新質(zhì)心的距離,并對(duì)比數(shù)據(jù)點(diǎn)到兩個(gè)新質(zhì)心的距離,選擇較小的距離值來確定數(shù)據(jù)點(diǎn)的分組。

        表2.2.5,計(jì)算出的新的均值為19.50和47.89,與原來的均值不同,故將新均值代替原有均值作為現(xiàn)在的質(zhì)心。

        算法停止條件

        開始計(jì)算的第一步,我們就說迭代計(jì)算每個(gè)數(shù)據(jù)到新質(zhì)心的距離,直到新質(zhì)心和原質(zhì)心相同,算法就結(jié)束。使用上一步分組得到的均值19.5和47.89作為新質(zhì)心,并計(jì)算年齡數(shù)據(jù)點(diǎn)到新質(zhì)心的距離,以下計(jì)算結(jié)果。

        使用質(zhì)心為19.50和47.89進(jìn)行數(shù)據(jù)分組,并計(jì)算每組的均值作為新的質(zhì)心,從表2.2.6可知,這里的均值和原質(zhì)心相等,也就是說新質(zhì)心與原質(zhì)心相同,都是19.50和47.89。這時(shí)算法停止計(jì)算,年齡數(shù)據(jù)點(diǎn)被劃分為兩類,對(duì)應(yīng)取值區(qū)間為15-28和35-65.這就是k均值聚類的一個(gè)全過程。

        3 k均值聚類的總結(jié)

        3.1 k均值聚類的優(yōu)點(diǎn)

        1)原理簡(jiǎn)單,容易實(shí)現(xiàn)

        2)可解釋性較強(qiáng)

        3)聚類效果較優(yōu)

        3.2 k均值聚類的缺點(diǎn):

        1)K值很難確定

        2)對(duì)噪音和異常點(diǎn)敏感

        3)需樣本存在均值(限定數(shù)據(jù)種類)

        4)采用迭代方法,得到的結(jié)果很有可能是局部最優(yōu)

        5)對(duì)于非凸數(shù)據(jù)集或類別規(guī)模差異太大的數(shù)據(jù)效果不好

        4 k均值聚類的應(yīng)用場(chǎng)景

        1)股票k線聚類

        2)商業(yè)銀行客戶分類

        3)葡萄酒分級(jí)

        4)高新技術(shù)信用評(píng)級(jí)

        參考文獻(xiàn)

        [1] https://www.cnblogs.com/zhzhang/p/5437778.html

        [2] https://blog.csdn.net/stayfoolish_fan/article/details/51888717

        [3] https://blog.51cto.com/janwool/2058124

        [4] https://blog.csdn.net/qq_42828404/article/details/81906809

        [5] https://blog.csdn.net/Dhane/article/details/86661208

        [6] https://www.cnblogs.com/bourneli/p/3645049.html


        (部分文字、圖片來自網(wǎng)絡(luò),如涉及侵權(quán),請(qǐng)及時(shí)與我們聯(lián)系,我們會(huì)在第一時(shí)間刪除或處理侵權(quán)內(nèi)容。電話:4006770986    負(fù)責(zé)人:張明)

        熱門文章 換一換
        文章推薦換一換
        輿情監(jiān)測(cè)關(guān)注問題換一換
        輿情監(jiān)測(cè)公司排名 輿情分析 輿情管理 輿情監(jiān)測(cè)系統(tǒng) 全網(wǎng)輿情監(jiān)測(cè)系統(tǒng) 輿情監(jiān)測(cè) 輿論 輿情監(jiān)測(cè)平臺(tái) 互聯(lián)網(wǎng)輿情監(jiān)測(cè) 輿情監(jiān)控系統(tǒng) 輿情監(jiān)測(cè)服務(wù)平臺(tái) 熱點(diǎn)輿情 網(wǎng)絡(luò)輿情分析報(bào)告 輿論聚焦 中山大學(xué)張鵬 超強(qiáng)臺(tái)風(fēng)山竹 個(gè)人所得稅起征點(diǎn) 微博傳播分析 網(wǎng)紅直播 手機(jī)輿情監(jiān)測(cè) 做好輿情監(jiān)控 輿情監(jiān)測(cè)報(bào)價(jià) 網(wǎng)絡(luò)熱點(diǎn)事件 輿情搜索 輿情預(yù)警系統(tǒng) 近期輿情 輿情報(bào)告 輿情 免費(fèi)輿情軟件 輿情監(jiān)測(cè)方案 輿情監(jiān)測(cè)解決方案 輿情是什么意思 網(wǎng)絡(luò)輿情監(jiān)測(cè) 輿情案例分析 專業(yè)輿情監(jiān)測(cè) 媒體輿情監(jiān)測(cè) 藥品安全事件 長(zhǎng)春長(zhǎng)生疫苗事件 潔潔良 樂清女孩 新浪微輿情 網(wǎng)絡(luò)輿情分析報(bào)告 2019網(wǎng)絡(luò)輿情事件 山東壽光水災(zāi) 社會(huì)輿情 輿情監(jiān)測(cè)哪家好 輿情監(jiān)測(cè)方法 輿情監(jiān)測(cè)報(bào)價(jià) 新浪輿情 手機(jī)輿情監(jiān)測(cè) 近期輿情 網(wǎng)紅直播 輿情事件 免費(fèi)輿情監(jiān)測(cè)軟件 社會(huì)輿情 網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng) 輿情監(jiān)測(cè)報(bào)告 輿情監(jiān)測(cè)軟件 網(wǎng)絡(luò)輿情監(jiān)測(cè)公司 互聯(lián)網(wǎng)輿情監(jiān)測(cè)系統(tǒng) 輿情監(jiān)測(cè)分析 輿情監(jiān)控前幾大公司 網(wǎng)絡(luò)輿情監(jiān)控軟件 網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng) 輿情監(jiān)控是什么意思 免費(fèi)輿情監(jiān)控 互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng) 網(wǎng)絡(luò)輿情分析 輿情 政務(wù)輿情 什么是輿情 新華網(wǎng)輿情在線 輿情監(jiān)控系統(tǒng) 互聯(lián)網(wǎng)輿情分析 社區(qū)輿情信息 網(wǎng)絡(luò)輿情信息 網(wǎng)絡(luò)輿情分析系統(tǒng) 網(wǎng)絡(luò)輿情管理 人民輿情監(jiān)控 軍犬網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng) 輿情監(jiān)控 涉警輿情 鷹擊 鷹眼輿情
        標(biāo)簽云 換一換
        疫情輿情分析報(bào)告 疫情輿情 抗擊疫情 疫情輿情分析 社會(huì)事件輿情分析 社會(huì)輿論熱點(diǎn) 輿情報(bào)告 輿情分析 輿情監(jiān)測(cè)系統(tǒng) 大數(shù)據(jù)輿情分析 政務(wù)輿情 屬地輿情監(jiān)測(cè) 行業(yè)輿情 輿情傳播 近期輿情 學(xué)校輿情 校園輿情 輿情匯總 大數(shù)據(jù)輿情監(jiān)測(cè) 互聯(lián)網(wǎng)輿情監(jiān)測(cè)平臺(tái) 地方輿情 旅游輿情 AI輿情監(jiān)測(cè)服務(wù)平臺(tái) 人工智能 輿情監(jiān)測(cè)平臺(tái) 2025年輿情報(bào)告 輿情分析研判 月度輿情分析 大數(shù)據(jù)服務(wù)平臺(tái) 輿情監(jiān)測(cè)預(yù)警 網(wǎng)絡(luò)輿情監(jiān)測(cè) 輿情風(fēng)險(xiǎn)監(jiān)測(cè) 互聯(lián)網(wǎng)輿情分析 大數(shù)據(jù)輿情 景區(qū)輿情 輿情輿論匯總 市場(chǎng)監(jiān)管 輿情周報(bào) 輿情信息收集 熱點(diǎn)監(jiān)測(cè) 教育輿情 輿情監(jiān)測(cè)解決方案 網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng) 免費(fèi)輿情監(jiān)測(cè)軟件 輿情監(jiān)測(cè)軟件 鷹眼速讀網(wǎng) 免費(fèi)輿情監(jiān)測(cè)系統(tǒng) 輿情預(yù)警系統(tǒng) 輿情預(yù)警 網(wǎng)絡(luò)傳播規(guī)律 輿情日?qǐng)?bào) 新聞傳播理論 網(wǎng)絡(luò)輿情監(jiān)測(cè)公司 輿情監(jiān)測(cè)工具 輿情管理 網(wǎng)絡(luò)輿情網(wǎng) 在線輿情監(jiān)測(cè) 輿情監(jiān)測(cè)方法 輿情查詢 網(wǎng)絡(luò)熱詞 涉警輿情 輿情風(fēng)險(xiǎn) 開源情報(bào)工具 信息挖掘 在線監(jiān)測(cè)軟件 2024年報(bào)告 輿情反轉(zhuǎn) 輿情研究 短視頻 視頻輿情監(jiān)測(cè) 社會(huì)輿情 假期輿情 消費(fèi)輿情 文旅輿情 輿情研判 醫(yī)院輿情 醫(yī)療輿情 輿情服務(wù) 輿情服務(wù)商 輿情監(jiān)測(cè) 全網(wǎng)輿情監(jiān)測(cè) 新聞?shì)浨?/a> 民生輿情 輿情監(jiān)測(cè)軟件排名 網(wǎng)絡(luò)輿情 輿情熱點(diǎn)事件 網(wǎng)絡(luò)安全 蟻坊軟件 輿情事件 金融輿情 金融監(jiān)督管理局 財(cái)經(jīng)金融輿情監(jiān)測(cè) 網(wǎng)絡(luò)熱點(diǎn)事件 突發(fā)公共事件 公安輿情監(jiān)測(cè)分析 公安類輿情 娛樂輿情 輿情系統(tǒng) AI輿情監(jiān)測(cè)服務(wù) AI輿情服務(wù) 輿論監(jiān)測(cè) 蟻坊 交通輿情 高校輿情 新媒體輿情 數(shù)據(jù)監(jiān)測(cè) 輿情數(shù)據(jù)分析 輿情治理 網(wǎng)絡(luò)輿情治理 網(wǎng)絡(luò)綜合治理 網(wǎng)絡(luò)信息生態(tài)治理 輿情應(yīng)對(duì) 應(yīng)急輿情 災(zāi)害輿情 應(yīng)急管理 輿論態(tài)勢(shì) 輿情信息分析 輿情回應(yīng) 公共事件輿情 輿情平臺(tái) 輿情態(tài)勢(shì) 農(nóng)業(yè)輿情 農(nóng)村輿情 老年人保護(hù)輿情 輿論風(fēng)險(xiǎn)防范 輿論監(jiān)測(cè)軟件 網(wǎng)絡(luò)輿論監(jiān)測(cè) 婦女兒童輿情 網(wǎng)紅直播 中國(guó)食品藥品安全輿情事件案例 網(wǎng)上輿情 安全生產(chǎn) 食品輿情 輿情搜索 涉穩(wěn)輿情 航空輿情 輿情監(jiān)測(cè)報(bào)價(jià) 傳播路徑分析 政府輿情 涉法輿情 檢察輿情 網(wǎng)絡(luò)輿情分析系統(tǒng) 社交媒體輿情 謠言傳播 輿情監(jiān)測(cè)方案 網(wǎng)絡(luò)社會(huì)熱點(diǎn)輿情分析系統(tǒng) 免費(fèi)大數(shù)據(jù)平臺(tái)有哪些 互聯(lián)網(wǎng)輿情監(jiān)測(cè)系統(tǒng)哪家好 互聯(lián)網(wǎng)輿情監(jiān)測(cè) 2023年輿情分析報(bào)告 電力輿情 高考輿情 互聯(lián)網(wǎng)輿情 政府輿情監(jiān)測(cè) 輿情監(jiān)測(cè)服務(wù)商 鐵路輿情 轄區(qū)輿情監(jiān)測(cè) 如何網(wǎng)絡(luò)輿情 能源輿情 企業(yè)輿情 政策輿情 危機(jī)公關(guān) 輿情告警 智慧城市 輿情案例 數(shù)據(jù)分析軟件有哪些 網(wǎng)信辦信息匯總 輿情監(jiān)測(cè)哪家好 鄉(xiāng)鎮(zhèn)輿情 稅務(wù)輿情 輿情處置 互聯(lián)網(wǎng)輿情監(jiān)測(cè)系統(tǒng) 生態(tài)環(huán)境輿情 負(fù)面輿情 消防救援輿情 輿情案例分析 地震輿情 明星輿情 新媒體輿情監(jiān)測(cè) 自媒體輿情監(jiān)測(cè) 輿情監(jiān)控前幾大公司 社交新全媒體監(jiān)測(cè)系統(tǒng)工具平臺(tái)公司 法治輿情 司法輿情 法院輿情 網(wǎng)紅輿情 23年輿情報(bào)告 網(wǎng)絡(luò)意識(shí)形態(tài) 涉毒輿情 科技輿情 鷹擊早發(fā)現(xiàn) 監(jiān)獄輿情輿論 大數(shù)據(jù)分析工具 做好輿情監(jiān)控 政府輿情監(jiān)測(cè)系統(tǒng) 媒體輿情 媒體輿論 網(wǎng)絡(luò)在線教學(xué)輿情 煙草輿情輿論 會(huì)議輿情 媒體監(jiān)測(cè) 環(huán)境輿情 聲量 輿情專報(bào) 次生輿情 輿情分析服務(wù) 輿論反應(yīng) 信息戰(zhàn) 輿論戰(zhàn) 輿論趨勢(shì) 新聞?shì)浾撽嚨毓芾?/a> 自媒體傳播 自媒體亂象 女權(quán)輿論 性別矛盾 民族宗教輿情 宗教輿情 銀行輿情 互聯(lián)網(wǎng)輿情治理 2022年輿情報(bào)告 未成年人輿情 輿情引導(dǎo) 兩會(huì)輿情 審計(jì)局 輿論失焦 政法輿情 網(wǎng)絡(luò)實(shí)名制 輿情監(jiān)督 奧運(yùn)會(huì) 疫情搜索大數(shù)據(jù) 輿論知識(shí)點(diǎn) 新疆棉花 社會(huì)情緒指數(shù) 正面輿情 網(wǎng)絡(luò)暴力 社會(huì)性死亡 辟謠 涉犬輿情 事件過程 鷹眼輿情 鷹擊 清博大數(shù)據(jù)輿情 輿情格式 抗疫英雄事跡輿情 虛假新聞 什么是輿情 2020年輿情報(bào)告 2020年輿情 深度學(xué)習(xí)算法 機(jī)器學(xué)習(xí) 輿論分析 輿情公關(guān) 虐童事件 反轉(zhuǎn)新聞 網(wǎng)紅 微輿情 微博傳播分析 手機(jī)輿情監(jiān)測(cè) 新浪輿情 新華輿情 2019網(wǎng)絡(luò)熱詞 網(wǎng)絡(luò)流行語 百度輿情監(jiān)測(cè) 企業(yè)危機(jī)管理 315 網(wǎng)絡(luò)輿情危機(jī) 互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng) 輿情是什么意思 德云社 網(wǎng)絡(luò)輿論分析 大數(shù)據(jù)輿情監(jiān)測(cè)案例 微博數(shù)據(jù)分析 輿情監(jiān)測(cè)公司 2019輿情熱點(diǎn) 犯罪輿情 股票輿情 消防輿情 微信輿情監(jiān)測(cè) 民航輿情 人物輿情 公益輿情 感動(dòng)中國(guó) 影視輿情 輿論監(jiān)督 2019輿情 2018輿情事件盤點(diǎn) 2018輿情報(bào)告 霧霾輿情 港澳臺(tái)輿情 涉軍輿情 拆遷輿情 反腐輿情 海外輿情 信息惠民 體育輿情 強(qiáng)拆輿情 輿情指數(shù) 環(huán)保輿情