您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

人工智能算法指南

2023-02-20 14:29 性質(zhì):原創(chuàng) 作者:Hu yangbo 來源:AGV網(wǎng)
免責(zé)聲明:中叉網(wǎng)(m.m21363.cn)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點,與本網(wǎng)無關(guān)。如有需要刪除,敬請來電商榷?。?/div>
算法定義了人工智能在處理和分析數(shù)據(jù)時將使用的規(guī)則、條件和方法。如果你以任何身份使用互聯(lián)網(wǎng),你將不可避免地遇到算法。從谷歌的搜索引擎到Facebook的時間軸算法,再到幫助金融機(jī)構(gòu)處理交易的系...

算法定義了人工智能在處理和分析數(shù)據(jù)時將使用的規(guī)則、條件和方法。

如果你以任何身份使用互聯(lián)網(wǎng),你將不可避免地遇到算法。從谷歌的搜索引擎到Facebook的時間軸算法,再到幫助金融機(jī)構(gòu)處理交易的系統(tǒng),算法是人工智能的基礎(chǔ)。

盡管算法是我們數(shù)字生活的核心,但除了創(chuàng)造它們的人之外,其他人往往不理解。臭名昭著的是,盡管其平臺支持近40萬名全職創(chuàng)作者,但Youtube的算法--它推薦視頻并關(guān)注與用戶興趣相關(guān)的頻道--因其是一個模糊的黑匣子而聞名,創(chuàng)作者們通過這個黑匣子來獲得財富和饑荒。

本文將照亮科技行業(yè)的這一基本方面。

什么是算法?

在基本術(shù)語中,算法是一組堅實定義的步驟,需要采取這些步驟以達(dá)到計劃的結(jié)果。特別是,它被用來解決數(shù)學(xué)方程。它可以被分解成三個廣泛的組成部分。

輸入:在問題開始時你已經(jīng)知道的信息。

算法:需要按部就班地實現(xiàn)的序列。

輸出:如果順序中的所有步驟都被完全遵循,那么預(yù)期的結(jié)果。

科技界以外的一個類似算法的系統(tǒng)的例子是烹飪食譜。你有你的輸入(原料),你有你的算法(需要或多或少準(zhǔn)確遵循的食譜步驟),你有你的輸出(希望可以食用的菜肴)。

當(dāng)我們說算法是我們數(shù)字生活的原子結(jié)構(gòu)的一部分時,我們也不是在開玩笑。你所使用的任何計算機(jī)程序都在運(yùn)行多種算法來執(zhí)行其功能。從你的網(wǎng)絡(luò)瀏覽器到你的文字處理器,再到自3.0版本以來一直包含在Windows中的微軟紙牌游戲,它們中的每一個都是依靠算法運(yùn)行的。

算法在人工智能中是如何工作的?

從根本上說,人工智能(AI)是一個計算機(jī)程序。這意味著,像火狐瀏覽器或微軟Word或Zoom或Slack一樣,你遇到的任何人工智能或機(jī)器學(xué)習(xí)(ML)解決方案將從頭開始用算法構(gòu)建。

算法在人工智能以及機(jī)器學(xué)習(xí)中的作用是可變的。廣義上講,它們定義了人工智能在處理和分析數(shù)據(jù)時將使用的規(guī)則、條件和方法。這可以簡單到定義人工智能處理一張發(fā)票所需的步驟,到讓人工智能在包含數(shù)十萬張圖片的數(shù)據(jù)集中過濾掉有狗的圖片。

機(jī)器學(xué)習(xí)中的算法有助于預(yù)測輸出,即使給定的是未知的輸入。人工智能算法通過解決不同類別的問題發(fā)揮類似的功能。人工智能算法解決的問題類型可以分為三大類。

分類。機(jī)器學(xué)習(xí)的一種類型,用于預(yù)測一個項目屬于哪一類,或哪一個類別。一個例子是通過編程讓人工智能區(qū)分垃圾信息和你真正需要的信息。

回歸。機(jī)器學(xué)習(xí)的一種類型,用于根據(jù)一個物體的功能來預(yù)測數(shù)字標(biāo)簽。一個例子是使用歷史數(shù)據(jù)來預(yù)測股票市場的價格和預(yù)測。

聚類。機(jī)器學(xué)習(xí)的一種類型,用于根據(jù)物體功能的相似性將其分為不同的組。一個例子是使用一種算法對一組金融交易進(jìn)行分類,并挑選出潛在的欺詐行為的實例。

另見。人工智能是如何通過人工智能增強(qiáng)改變軟件開發(fā)的

人工智能算法的類型

分類算法

下面是一些用于人工智能和機(jī)器學(xué)習(xí)的分類算法的例子。

二元邏輯回歸

二元邏輯回歸可以預(yù)測一個二元結(jié)果,如是/否或通過/失敗。其他形式的邏輯回歸,如多項式回歸,可以預(yù)測三種或更多的可能結(jié)果。邏輯回歸經(jīng)常可以在疾病預(yù)測、欺詐檢測和流失預(yù)測等用例中發(fā)現(xiàn),其數(shù)據(jù)集可以被用來評估風(fēng)險。

奈何貝葉斯(Naive Bayes)

奈何貝葉斯是一種概率算法,它將獨立假設(shè)納入模型,這意味著它的操作假設(shè)是數(shù)據(jù)集中沒有兩個測量值是相互關(guān)聯(lián)或以任何方式相互影響的。這就是它們被稱為 "天真 "的原因。它通常用于文本分析和分類模型,它可以將單詞和短語分類到指定的類別。

K 最近鄰 (k-NN)

雖然有時也用于解決回歸問題,但k-NN最常用于解決分類問題。在解決分類問題時,它將數(shù)據(jù)點分成多個類別到一個平面上,以預(yù)測新數(shù)據(jù)點的類別標(biāo)簽。新數(shù)據(jù)點根據(jù)平面上最常出現(xiàn)在其周圍的類別標(biāo)簽進(jìn)行新分類。k-NN 也被稱為“惰性學(xué)習(xí)”算法,這意味著它不經(jīng)過完整的訓(xùn)練步驟,而只是保存訓(xùn)練數(shù)據(jù)集。

決策樹

作為一種監(jiān)督學(xué)習(xí)算法,決策樹也可用于分類問題或回歸問題。之所以稱為“樹”,是因為它具有層次結(jié)構(gòu)。從根節(jié)點開始,它分支成更小的內(nèi)部節(jié)點或決策節(jié)點,在這些節(jié)點中進(jìn)行評估以生成子集,這些子集由終端節(jié)點或葉節(jié)點表示。

一個例子是從武術(shù)的根節(jié)點開始,然后將其分為具有引人注目的重點的武術(shù)和具有格斗重點的武術(shù)的內(nèi)部節(jié)點。然后,這些內(nèi)部節(jié)點可以拆分為特定武術(shù)的終端節(jié)點,例如拳擊、柔術(shù)和泰拳。這些算法非常適合數(shù)據(jù)挖掘和知識發(fā)現(xiàn)任務(wù),因為它們易于解釋并且只需要很少的數(shù)據(jù)準(zhǔn)備就可以部署。

隨機(jī)森林

隨機(jī)森林利用多個決策樹的輸出來產(chǎn)生預(yù)測。與決策樹一樣,隨機(jī)森林可用于解決分類和回歸問題。每棵樹都由從訓(xùn)練數(shù)據(jù)集中抽取的數(shù)據(jù)樣本組成,該數(shù)據(jù)樣本使用放回抽樣。這為決策樹增加了隨機(jī)化,即使它們來自完全相同的數(shù)據(jù)集。

在分類問題中,多數(shù)票是由這些隨機(jī)決策樹的輸出決定的。例如,假設(shè)有 10 個決策樹專門用于確定裙子的顏色。三套說是藍(lán)色,兩套說是黑色,四套說是粉色,一套說是紅色。這件衣服將被歸類為粉紅色。

隨機(jī)森林是金融機(jī)器學(xué)習(xí)模型的首選算法,因為它可以減少預(yù)處理和數(shù)據(jù)管理任務(wù)所需的時間。欺詐檢測、期權(quán)定價和客戶信用風(fēng)險評估都是其在金融領(lǐng)域的應(yīng)用實例。隨機(jī)森林算法是Leo Breiman 和 Adele Cutler 的商標(biāo)。

回歸算法

以下是人工智能和機(jī)器學(xué)習(xí)中使用的回歸算法的一些示例。

線性回歸

線性回歸是一種在統(tǒng)計學(xué)和社會科學(xué)中都使用的算法,用于定義因變量和自變量之間的線性關(guān)系。這種算法的目標(biāo)是用給定的數(shù)據(jù)點確定一條可能的趨勢線。在確定廣告支出如何影響收入時,企業(yè)通常會使用線性回歸。

泊松回歸

泊松回歸是一種回歸,其中始終假設(shè)預(yù)測變量服從泊松分布。泊松分布是一種概率函數(shù),可以幫助確定給定數(shù)量的事件在特定的固定時間段內(nèi)發(fā)生的概率。

例如,您可以使用泊松回歸來確定一個高中生班級在 24 小時內(nèi)解決魔方的可能性有多大?;蛘?,您可以根據(jù)餐廳一周內(nèi)服務(wù)的平均用餐人數(shù)來預(yù)測餐廳在特定日期接待更多顧客的可能性。

普通最小二乘 (OLS) 回歸

OLS 回歸是最流行的回歸算法之一,它以序數(shù)值作為輸入來確定多個變量之間的線性關(guān)系。該算法在預(yù)測某項事物在任意范圍內(nèi)排名的可能性時最有用,例如在 1-10 范圍內(nèi),一款游戲被評為 7 的可能性有多大。它經(jīng)常用于社會科學(xué),因為該領(lǐng)域的調(diào)查經(jīng)常要求參與者按比例評估某些事物。OLS 回歸也稱為排序?qū)W習(xí)。

套索(最小絕對選擇和收縮算子)回歸

套索回歸采用 OLS 回歸并在方程中添加一個懲罰項。這可以幫助您創(chuàng)建比簡單 OLS 更復(fù)雜的數(shù)據(jù)表示。它還可以使表示更準(zhǔn)確。套索回歸也稱為 L1 正則化。

神經(jīng)網(wǎng)絡(luò)回歸

神經(jīng)網(wǎng)絡(luò)是目前最流行的 AI 和 ML 訓(xùn)練方法之一。顧名思義,它們受到人腦的啟發(fā),并且擅長處理對于更常見的機(jī)器學(xué)習(xí)方法來說太大而無法持續(xù)處理的數(shù)據(jù)集。

神經(jīng)網(wǎng)絡(luò)是一種多功能工具,只要提供適當(dāng)數(shù)量的先驗數(shù)據(jù)來預(yù)測未來事件,就可以執(zhí)行回歸分析。例如,您可以向神經(jīng)網(wǎng)絡(luò)提供客戶的網(wǎng)絡(luò)活動數(shù)據(jù)和元數(shù)據(jù),以確定客戶不買任何東西就離開您的網(wǎng)站的可能性有多大。

聚類算法

以下是人工智能和機(jī)器學(xué)習(xí)中使用的聚類算法的一些示例。

K-均值聚類

k 均值聚類是一種無監(jiān)督學(xué)習(xí)算法,它采用具有某些特征和與這些特征相關(guān)的值的數(shù)據(jù)集,并將數(shù)據(jù)點分組到多個集群中。“K”代表您嘗試將數(shù)據(jù)點分類到的簇數(shù)。K-means 聚類擁有許多可行的用例,包括文檔分類、保險欺詐檢測和通話詳細(xì)記錄分析。

均值偏移聚類

均值偏移聚類是一種簡單、靈活的聚類技術(shù),通過將點移向數(shù)據(jù)點密度最高的區(qū)域(稱為模式),將數(shù)據(jù)點分配到聚類中。在此設(shè)置中如何定義集群取決于多種因素,例如距離、密度和分布。它也被稱為“模式搜索算法”。均值漂移聚類在圖像處理、計算機(jī)視覺、客戶細(xì)分和欺詐檢測等領(lǐng)域都有用例。

基于密度的噪聲應(yīng)用空間聚類 (DBSCAN)

DBSCAN 在數(shù)據(jù)點密度較低的點將高密度簇彼此分開。Netflix 的電影推薦算法使用類似的聚類方法來確定接下來向您推薦什么。

例如,如果你觀看了最近的 Netflix 電影“Do Revenge”,該算法會查看其他也觀看過“Do Revenge”的用戶,并根據(jù)這些用戶接下來觀看的內(nèi)容推薦電影和節(jié)目。DBSCAN 擅長處理數(shù)據(jù)集中的異常值。DBSCAN 的可行用例包括客戶細(xì)分、市場研究和數(shù)據(jù)分析。

使用層次結(jié)構(gòu)的平衡迭代減少和聚類(BIRCH)

BIRCH 是一種常用于處理大型數(shù)據(jù)集的聚類技術(shù)。它可以一次掃描整個數(shù)據(jù)庫,并專注于數(shù)據(jù)庫中數(shù)據(jù)點密度高的空間,并提供精確的數(shù)據(jù)摘要。

實現(xiàn) BIRCH 的一種常見方法是與其他無法處理大型數(shù)據(jù)集的聚類方法一起使用。在 BIRCH 生成其摘要后,其他聚類方法將運(yùn)行摘要并對其進(jìn)行聚類。因此,BIRCH 的最佳用例是用于普通聚類方法無法有效處理的大型數(shù)據(jù)集。

高斯混合模型 (GMM)

與泊松回歸利用泊松分布的概念非常相似,GMM 將數(shù)據(jù)集建模為多個高斯分布模型的混合體。高斯分布也稱為“正態(tài)分布”,因此,可以直觀地假設(shè)數(shù)據(jù)集的聚類將沿著高斯分布的線分布。

GMM 可用于處理大型數(shù)據(jù)集,因為它保留了奇異高斯模型的許多優(yōu)點。GMM 已在語音識別系統(tǒng)、異常檢測和股票價格預(yù)測中得到應(yīng)用。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞