內(nèi)部員工稱蘋果AI至少落后2年,兩大掣肘讓蘋果難以實(shí)現(xiàn)AI技術(shù)超越?

2024-10-22 9:27:00
  • 內(nèi)部員工稱蘋果AI至少落后2年,兩大掣肘讓蘋果難以實(shí)現(xiàn)AI技術(shù)超越?

內(nèi)部員工稱蘋果AI至少落后2年,兩大掣肘讓蘋果難以實(shí)現(xiàn)AI技術(shù)超越?

蘋果最新的AI功能

在今年的蘋果全球開發(fā)者大會上,Apple Intelligence的亮相引起了廣泛的關(guān)注。在6月10日,蘋果公司宣布,個人智能化系統(tǒng)Apple Intelligence將為iPhone、iPad和Mac引入強(qiáng)大的生成式模型,為人工智能隱私樹立了新標(biāo)準(zhǔn),它能夠理解個人背景,從而提供有用且相關(guān)的資訊。

根據(jù)蘋果官方新聞稿,Apple Intelligence深度集成于iOS 18、iPadOS 18和macOS Sequoia中,充分運(yùn)用Apple芯片對語言和圖像的理解與創(chuàng)作能力,可做出多種跨App操作,同時結(jié)合個人場景,為用戶簡化和加快日常任務(wù)流程。

按照蘋果公司的設(shè)想,Apple Intelligence會帶來多個創(chuàng)新功能。在iOS 18、iPadOS 18和macOS Sequoia中會新增一個新的工具——Writing Tools。作為一款智能化的書寫工具,Writing Tools能夠?yàn)橛脩魩砗芏鄤?chuàng)新體驗(yàn)。比如,它可以幫助用戶校對文本,包括單詞選擇和句子的格式;可以重寫當(dāng)前的內(nèi)容,而不改變用戶的本意;可以對文本進(jìn)行總結(jié),用戶可以將這些結(jié)論作為關(guān)鍵點(diǎn)匯總,或者繪制成表格,這些摘要可以在郵件和信息應(yīng)用中找到。

Apple Intelligence對Siri進(jìn)行了全面的重構(gòu),使其具有更深的學(xué)習(xí)能力和更靈活的交互方式。Mark Gurman此前在報道中透露,Siri將能夠分析用戶的習(xí)慣、偏好,并提供個性化的建議。Siri里面也會加入一些新的工具,比如ImagePlayground、Genmoji等。這些工具均旨在提升用戶創(chuàng)作趣味,以及社交互動的豐富度。

蘋果官方對于ImagePlayground也會倍加推崇,認(rèn)為其將為用戶提供樂趣無窮的圖像創(chuàng)作功能,幫助用戶用全新方式進(jìn)行交流和表達(dá)自我。ImagePlayground被內(nèi)置在多款A(yù)pp中,借助這款工具,用戶可以在數(shù)秒間創(chuàng)作出有趣的圖像,且有動畫、插畫、手繪三種樣式可以選擇。用戶還可以將使用ImagePlayground創(chuàng)作的趣味圖像發(fā)送給朋友,甚至還會看到基于當(dāng)前對話生成的個性化創(chuàng)意推薦。

當(dāng)然,Apple Intelligence對于Siri的改變遠(yuǎn)不止于此。Siri還將有能力在各類Apple及第三方App中完成數(shù)百種新操作,且對于用戶指令的執(zhí)行更加準(zhǔn)確,并具有個性定制的屬性。參考蘋果官方給出的示例,用戶只需說出“從我的閱讀列表里調(diào)出那篇關(guān)于蟬的文章”,或者“把周六那天的燒烤照片發(fā)給Malia”,Siri便會執(zhí)行。

Apple Intelligence背后據(jù)悉擁有兩套模型。本地模型是一個參數(shù)規(guī)模為3B的語言模型,測試得分高于Mistral-7B或Gemma-7B等市場上的7B模型;云上模型則是蘋果在云端服務(wù)器部署的更大規(guī)模的大模型,云端大模型能夠支持100k的詞匯大小,而終端模型支持的是49k的詞匯大小。

對于蘋果公司而言,更顯AI戰(zhàn)略有重大改變的行為是,蘋果公司將會在全平臺中集成ChatGPT,用戶利用Siri可以直接調(diào)用ChatGPT被集成的功能,如圖像生成、文檔理解等。用戶也可以在Writing Tools等工具中使用ChatGPT的特殊功能,協(xié)助用戶在自己的主題下生成需要的內(nèi)容。

對于蘋果Apple Intelligence的功能,用戶肯定是十分期待,不過何時更新,還不太確定。Mark Gurman此前稱,Siri的新特性預(yù)計(jì)將在iOS18.3系統(tǒng)中首次現(xiàn)身,這一時間點(diǎn)比之前設(shè)想的iOS18.4版本提前。不過,最近有用戶在推特上發(fā)文稱,已經(jīng)在蘋果下一版系統(tǒng)要更新的代碼中出現(xiàn)對集成ChatGPT的描述,預(yù)計(jì)即將發(fā)布的 iOS 18.2 Beta中就會出現(xiàn)支持ChatGPT的Siri和iPhone 16的視覺智能。

蘋果的AI創(chuàng)新挑戰(zhàn)

雖然看起來蘋果的AI創(chuàng)新還不錯,且部分更新比預(yù)期的提前了,不過蘋果內(nèi)部員工對于該公司的AI水平并不滿意。確實(shí),深究蘋果即將推出的AI應(yīng)用,并沒有出現(xiàn)行業(yè)創(chuàng)新引領(lǐng)的功能,都是別人已經(jīng)展示過的AI應(yīng)用。

蘋果公司的內(nèi)部測試顯示,與蘋果的Siri相比,ChatGPT的準(zhǔn)確率要高出大約25%,并且能夠回答的問題也多出約30%。因此,不少蘋果技術(shù)人員認(rèn)為,該公司的AI技術(shù)水平相較于最前沿的AI技術(shù),落后了至少2年的時間。

為什么作為全球科技巨頭的蘋果,在關(guān)鍵的AI技術(shù)上落后了呢。目前來看,有兩大重要的原因。其一是蘋果的創(chuàng)新思維,過去很多年,蘋果一直在以硬件創(chuàng)新為主導(dǎo),尤其是在智能手機(jī)方面,iPhone的創(chuàng)新能力讓全球科技人致敬。實(shí)際上,這些年蘋果一直在踐行創(chuàng)始人喬布斯的信念,那就是打造一個端到端的硬件全家桶,引領(lǐng)全球消費(fèi)電子硬件產(chǎn)品的發(fā)展。

也就是在近幾年,蘋果在硬件創(chuàng)新方面開始乏力,設(shè)備全新外觀、更強(qiáng)大的處理器、更強(qiáng)大的攝像頭、新材料等蘋果賴以成名的硬件創(chuàng)新方式,近兩年的表現(xiàn)很難讓人信服,因而產(chǎn)業(yè)界才開始更加關(guān)注蘋果的AI技術(shù)創(chuàng)新。但蘋果顯然仍在經(jīng)歷硬件創(chuàng)新引領(lǐng)轉(zhuǎn)變?yōu)檐浖?chuàng)新引領(lǐng)的陣痛。

原因之二是蘋果公司對于數(shù)據(jù)的保護(hù)態(tài)度,也就是蘋果的隱私政策限制了蘋果的AI創(chuàng)新。數(shù)據(jù)是AI技術(shù)發(fā)展的基礎(chǔ),沒有數(shù)據(jù)的支持,再先進(jìn)的算法和算力也無法發(fā)揮作用。要打造強(qiáng)大的AI模型,需要三項(xiàng)數(shù)據(jù)支撐:第一是高質(zhì)量的數(shù)據(jù)集,能夠顯著提高AI大模型的精度與可解釋性,并減少訓(xùn)練時長;第二是數(shù)據(jù)多樣性,有助于模型更好地理解和捕捉不同的概念、語義和語法結(jié)構(gòu),從而提高其泛化能力;第三是大規(guī)模數(shù)據(jù)集,更大數(shù)據(jù)集通常意味著能夠提供更豐富的信息供AI學(xué)習(xí),減少擬合信息的輸出,特別是對于深度學(xué)習(xí)模型而言,龐大的數(shù)據(jù)量是提高其性能的關(guān)鍵。

然而,保護(hù)隱私是蘋果公司的金字招牌,這就導(dǎo)致蘋果公司很難從其龐大的用戶群里中間獲取到大量的、有用的數(shù)據(jù),因此到今天仍有相當(dāng)一部分的Siri的答案來自人工撰寫,這和ChatGPT生成差距明顯。

生成式AI的下一步

隨著蘋果公司在全平臺集成ChatGPT,蘋果產(chǎn)品體現(xiàn)出來的AI能力并不會是弱項(xiàng),因?yàn)镺penAI就是全球頂尖的AI公司。那么,后續(xù)蘋果自己的AI技術(shù)還有希望趕超嗎?我們先看一下生成式AI后續(xù)的趨勢。

首先是強(qiáng)化學(xué)習(xí)和生成的融合。強(qiáng)化學(xué)習(xí)是一種通過與環(huán)境交互學(xué)習(xí)最優(yōu)行為策略的機(jī)器學(xué)習(xí)方法,而生成式AI則是一種通過學(xué)習(xí)數(shù)據(jù)分布來生成新數(shù)據(jù)的技術(shù)。通過在生成式AI生成的過程中引入強(qiáng)化學(xué)習(xí),可以增強(qiáng)圖像生成和編輯、自然語言生成、視頻生成、音頻生成等方面的能力。不過,相較于完全推理生成,加入強(qiáng)化生成可能會帶來生成答案的延遲,但結(jié)果質(zhì)量會更高。

其次是跨模態(tài)生成能力提升,跨模態(tài)是指處理來自不同感官通道或表現(xiàn)形式的信息的能力,例如文本、圖像、音頻、視頻等。跨模態(tài)理解與生成技術(shù)的目的在于建立不同模態(tài)信息之間的橋梁,實(shí)現(xiàn)它們之間的轉(zhuǎn)換和交互。這種能力提升的意義在于,它能夠突破單一模態(tài)的局限性,充分利用多模態(tài)信息的互補(bǔ)性,提高信息處理的準(zhǔn)確性和豐富性。

第三是深度個性化生成,目前生成式AI 大多是基于大規(guī)模數(shù)據(jù)集的訓(xùn)練,生成結(jié)果缺乏個性化和定制化,隨著算法的更新以及用戶數(shù)據(jù)的進(jìn)一步收集,可以讓模型生成更加趨向于個人定制。

此外還有減少模型幻覺、提升模型創(chuàng)造力等。不過,在這些趨勢里,有兩個關(guān)鍵的因素,一個是算法,還有一個是數(shù)據(jù)。我們相信蘋果軟件算法團(tuán)隊(duì)的能力,但是蘋果如果難以解決數(shù)據(jù)難題,那么其AI技術(shù)恐怕難以追上頂尖對手。

結(jié)語

Apple Intelligence讓蘋果的AI似乎又沒有那么落后了,但其中一部分功勞要?dú)w功于OpenAI公司的ChatGPT,蘋果自己的AI技術(shù)正如其員工所言,仍至少落后兩年。生成式AI下一步的趨勢已經(jīng)明朗,但蘋果自身的障礙仍在,目前來看除了引入外援,蘋果很難靠自己引領(lǐng)AI創(chuàng)新了。