人工智能(AI)不再是一個(gè)未來(lái)的實(shí)驗(yàn)——它是自動(dòng)化、分析、個(gè)性化和創(chuàng)新的支柱,覆蓋幾乎所有行業(yè)。從金融機(jī)構(gòu)在毫秒內(nèi)偵測(cè)欺詐,到醫(yī)療服務(wù)提供者提供AI輔助診斷,AI驅(qū)動(dòng)應(yīng)用的需求正以前所未有的速度加速。
但隨著人工智能的普及,一個(gè)關(guān)鍵基礎(chǔ)設(shè)施問(wèn)題日益突出:人工智能訓(xùn)練和推理應(yīng)存在于云端、邊緣,還是結(jié)合兩者的混合模型中?
簡(jiǎn)短回答:這取決于延遲需求、成本結(jié)構(gòu)、數(shù)據(jù)的比重、監(jiān)管因素以及整體AI生命周期。正確的選擇不是簡(jiǎn)單的二元對(duì)立。
在這份擴(kuò)展指南中,我們將深入探討:
人工智能生命周期及基礎(chǔ)設(shè)施如何影響各階段
基于云的人工智能訓(xùn)練的優(yōu)勢(shì)與挑戰(zhàn)
為什么邊緣人工智能在實(shí)時(shí)應(yīng)用中日益普及
混合云邊緣戰(zhàn)略如何成為行業(yè)標(biāo)準(zhǔn)
真實(shí)世界的應(yīng)用場(chǎng)景,突出決策過(guò)程
一個(gè)實(shí)用的框架,幫助你在云端、邊緣或兩者之間做出選擇
在決定AI應(yīng)走向何處之前,了解AI的具體表現(xiàn)非常重要。AI生命周期主要包括兩個(gè)階段:訓(xùn)練和推理。每個(gè)平臺(tái)的基礎(chǔ)設(shè)施需求非常不同。
培訓(xùn)
訓(xùn)練是教AI模型如何做決策的過(guò)程。其內(nèi)容包括:
處理海量數(shù)據(jù)集——通常規(guī)模達(dá)拍字節(jié)
在高性能GPU或TPU上運(yùn)行數(shù)天甚至數(shù)周
并行處理復(fù)雜數(shù)學(xué)運(yùn)算
反復(fù)存儲(chǔ)和訪問(wèn)海量數(shù)據(jù)
例如:訓(xùn)練大型語(yǔ)言模型(LLM)如GPT或用于自動(dòng)駕駛的計(jì)算機(jī)視覺(jué)模型。
訓(xùn)練計(jì)算量大、存儲(chǔ)密集型,并且需要數(shù)據(jù)與處理硬件之間穩(wěn)定、高帶寬的連接。
推斷
推斷是部署訓(xùn)練好的模型以實(shí)時(shí)進(jìn)行預(yù)測(cè)的階段。這可能意味著:
在監(jiān)控?cái)z像頭畫(huà)面中識(shí)別一張面孔
向電商客戶推薦產(chǎn)品
移動(dòng)設(shè)備上的語(yǔ)音翻譯
預(yù)測(cè)工廠機(jī)器何時(shí)會(huì)失效
與培訓(xùn)不同,推理通常優(yōu)先考慮低延遲、可用性和與終端用戶的接近性,而非純粹的計(jì)算能力。
基本結(jié)論是:培訓(xùn)功能繁重,受益于集中化、可擴(kuò)展的資源,而推斷則時(shí)間緊迫,通常更靠近用戶或設(shè)備。
AI訓(xùn)練云:標(biāo)準(zhǔn)模型
過(guò)去十年,云計(jì)算一直是人工智能訓(xùn)練的首選基礎(chǔ)設(shè)施——這是有充分理由的。領(lǐng)先的云服務(wù)提供商如AWS、Microsoft Azure和Google Cloud Platform已投入數(shù)十億美元建設(shè)AI兼容基礎(chǔ)設(shè)施。
1. 按需規(guī)模化
云平臺(tái)允許團(tuán)隊(duì)即時(shí)啟動(dòng)數(shù)千個(gè)GPU或TPU,實(shí)現(xiàn)大規(guī)模并行處理。在有限的本地集群上可能需要數(shù)月時(shí)間的事情,在云端完成時(shí)只需極短時(shí)間。
2. 高性能計(jì)算
云服務(wù)提供商提供專門(mén)的人工智能硬件,如NVIDIA A100 GPU、谷歌TPU和AMD Instinct加速器,針對(duì)矩陣運(yùn)算和深度學(xué)習(xí)工作負(fù)載進(jìn)行了優(yōu)化。
3. 數(shù)據(jù)集中化
許多組織已經(jīng)將訓(xùn)練數(shù)據(jù)集存儲(chǔ)在云對(duì)象存儲(chǔ)中,如亞馬遜S3、Azure Blob存儲(chǔ)或谷歌云存儲(chǔ)。在同一環(huán)境中訓(xùn)練可以最大限度地降低數(shù)據(jù)傳輸成本并加快訪問(wèn)速度。
4. 實(shí)驗(yàn)的靈活性
按需配置和取消資源的能力使得測(cè)試不同架構(gòu)、參數(shù)調(diào)優(yōu)和預(yù)處理流水線變得容易,無(wú)需等待硬件可用。
1. 長(zhǎng)期成本
雖然按需付費(fèi)聽(tīng)起來(lái)很吸引人,但大規(guī)模模型培訓(xùn)很快就會(huì)累積六位數(shù)甚至七位數(shù)的費(fèi)用,尤其是那些需要反復(fù)再培訓(xùn)的項(xiàng)目。
2. 供應(yīng)商鎖定
使用專有的AI服務(wù)(如Vertex AI、SageMaker)會(huì)使更換服務(wù)提供商變得困難,除非重寫(xiě)流水線和重新訓(xùn)練模型。
3. 分布式團(tuán)隊(duì)的延遲
分布在各地的數(shù)據(jù)科學(xué)家如果云區(qū)域距離他們所在地較遠(yuǎn),訪問(wèn)GPU或數(shù)據(jù)集可能會(huì)遇到延遲。
Edge AI:推理與超越
邊緣計(jì)算使數(shù)據(jù)處理更接近數(shù)據(jù)生成地——無(wú)論是物聯(lián)網(wǎng)設(shè)備、工業(yè)網(wǎng)關(guān)、自動(dòng)駕駛車輛還是本地微型數(shù)據(jù)中心。對(duì)于人工智能來(lái)說(shuō),邊緣計(jì)算通常與推理相關(guān),而非訓(xùn)練。
1. 實(shí)時(shí)響應(yīng)性
自動(dòng)駕駛、機(jī)器人技術(shù)、增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)等應(yīng)用需要不到10毫秒的延遲。將數(shù)據(jù)發(fā)送到云端再返回可能耗時(shí)過(guò)長(zhǎng)。
2. 帶寬限制
在互聯(lián)網(wǎng)連接有限或昂貴的偏遠(yuǎn)環(huán)境中——如農(nóng)村農(nóng)場(chǎng)、石油鉆井平臺(tái)或海上船只——本地處理數(shù)據(jù)效率更高。
3. 數(shù)據(jù)隱私與合規(guī)
受監(jiān)管行業(yè)如醫(yī)療、金融和政府可能被禁止向公共云環(huán)境發(fā)送敏感原始數(shù)據(jù)。
4. 離線人工智能
邊緣設(shè)備即使在沒(méi)有網(wǎng)絡(luò)連接的情況下也能運(yùn)行推理,確保在不穩(wěn)定的網(wǎng)絡(luò)條件下持續(xù)運(yùn)行。
Edge AI 的主要優(yōu)勢(shì)
最低延遲——處理在現(xiàn)場(chǎng)進(jìn)行,避免云端往返延遲。
降低云計(jì)算成本——需要在云中傳輸或存儲(chǔ)的數(shù)據(jù)減少。
隱私保護(hù)——敏感數(shù)據(jù)可以在本地處理和丟棄,而無(wú)需離開(kāi)設(shè)備。
運(yùn)營(yíng)韌性——即使在網(wǎng)絡(luò)完全中斷時(shí),人工智能依然能發(fā)揮作用。
越來(lái)越多的組織采用結(jié)合云端和邊緣的混合型人工智能策略:
利用大規(guī)模計(jì)算資源在云中訓(xùn)練。
優(yōu)化和壓縮模型(量化、剪枝)以便部署。
部署到邊緣設(shè)備以實(shí)現(xiàn)低延遲推理。
將邊緣選定的數(shù)據(jù)回傳到云端進(jìn)行重新訓(xùn)練。
該型號(hào)提供:
云計(jì)算在資源密集型訓(xùn)練中的強(qiáng)大力量。
面向終端用戶的預(yù)測(cè)中,邊緣的速度。
通過(guò)減少不必要的數(shù)據(jù)傳輸來(lái)實(shí)現(xiàn)成本效益。
混合用例示例
智能工廠——人工智能通過(guò)在云基礎(chǔ)設(shè)施上訓(xùn)練的邊緣部署模型預(yù)測(cè)設(shè)備故障。
零售自助終端——AI通過(guò)即時(shí)設(shè)備推斷個(gè)性化店內(nèi)產(chǎn)品,培訓(xùn)則在云端進(jìn)行。
語(yǔ)音助手——設(shè)備內(nèi)喚醒詞檢測(cè)與基于云的自然語(yǔ)言處理模型訓(xùn)練相結(jié)合。
現(xiàn)實(shí)例子:智能農(nóng)業(yè)中的人工智能
一家精準(zhǔn)農(nóng)業(yè)公司利用無(wú)人機(jī)、土壤傳感器和氣象數(shù)據(jù)來(lái)優(yōu)化作物產(chǎn)量:
云訓(xùn)練——數(shù)十億個(gè)來(lái)自過(guò)去季節(jié)的數(shù)據(jù)點(diǎn)、衛(wèi)星影像和物聯(lián)網(wǎng)傳感器在云中被處理,用于訓(xùn)練作物預(yù)測(cè)模型。
邊緣推斷——該模型的輕量級(jí)版本運(yùn)行在現(xiàn)場(chǎng)部署的設(shè)備上,無(wú)需互聯(lián)網(wǎng)接入即可實(shí)時(shí)提供灌溉和施肥建議。
持續(xù)改進(jìn)——每個(gè)季節(jié),現(xiàn)場(chǎng)數(shù)據(jù)都會(huì)有選擇地同步回云端,以完善模型。
這種混合方式實(shí)現(xiàn)了實(shí)時(shí)決策,同時(shí)降低了成本和連接需求。
人工智能基礎(chǔ)設(shè)施的未來(lái):靈活且集成
2025年及以后,人工智能基礎(chǔ)設(shè)施將不再是放諸四海而皆準(zhǔn)的。雖然云端仍是大規(guī)模培訓(xùn)的支柱,但邊緣在于人工智能與現(xiàn)實(shí)世界的交匯——推動(dòng)即時(shí)決策、離線能力和合規(guī)友好的部署。
獲勝策略將是靈活、混合且集成的,通過(guò)以下方式連接云與邊緣:
API 與編排層
機(jī)器學(xué)習(xí)模型的CI/CD流水線
邊緣設(shè)備的空中(OTA)更新
用于保護(hù)隱私的模型改進(jìn)的聯(lián)邦學(xué)習(xí)
掌握這一平衡的組織將獲得競(jìng)爭(zhēng)優(yōu)勢(shì)——不僅在人工智能性能上,還在敏捷性、可擴(kuò)展性和客戶體驗(yàn)方面。
Copyright ? 2013-2020. All Rights Reserved. 恒訊科技 深圳市恒訊科技有限公司 粵ICP備20052954號(hào) IDC證:B1-20230800.移動(dòng)站


