當(dāng)你詢問(wèn)AI助手“哪款耳機(jī)性價(jià)比高”時(shí),它會(huì)將不同型號(hào)耳機(jī)的價(jià)格以及核心亮點(diǎn)一一列出,并站在使用者的角度,“貼心”地分析每款耳機(jī)的性價(jià)比。
不過(guò),面對(duì)AI的介紹,你是否懷疑過(guò),那個(gè)被它反復(fù)提及并在推薦中居首位的產(chǎn)品,真的是“最優(yōu)選”嗎?看似客觀的回答背后,是否隱藏著精心設(shè)計(jì)的商業(yè)暗廣?

誰(shuí)在操控AI的“偏好”?

GEO服務(wù)機(jī)構(gòu)宣傳內(nèi)容
電商平臺(tái)上,一種名為“GEO”的操作正悄然嵌入各類(lèi)AI助手的信息流中。不少機(jī)構(gòu)聲稱(chēng),GEO優(yōu)化能實(shí)現(xiàn)“躺著漲流量”,它可以通過(guò)訓(xùn)練大模型的方式“修繕”品牌形象。機(jī)構(gòu)還許諾,能讓品牌方穩(wěn)坐AI推薦中的首位。用服務(wù)機(jī)構(gòu)的宣傳語(yǔ)來(lái)講,GEO就像把“撒網(wǎng)捕魚(yú)”變成“精準(zhǔn)垂釣”,它能確保AI直接把品牌信息裝進(jìn)回答里。
中國(guó)科學(xué)院自動(dòng)化研究所研究員吳書(shū)介紹,GEO的全稱(chēng)為“生成引擎優(yōu)化”,其原理可類(lèi)比公眾更為熟悉的SEO(搜索引擎優(yōu)化)。SEO是商家利用搜索引擎的算法,將自己的鏈接排到搜索結(jié)果的前列,而GEO則是AI時(shí)代的產(chǎn)物,是一種專(zhuān)門(mén)“讓AI看到”的優(yōu)化方法,其目的是讓特定的觀點(diǎn)或品牌信息在AI的輸出中獲得更高的曝光率。
為探明GEO服務(wù)的真實(shí)效果,《鋒面》記者以品牌工作人員的身份咨詢了多家GEO服務(wù)機(jī)構(gòu)。接待人員均表示GEO服務(wù)能“立竿見(jiàn)影”地提升品牌在AI問(wèn)答中的“能見(jiàn)度”,并反復(fù)向記者強(qiáng)調(diào)當(dāng)下布局GEO的緊迫性。對(duì)方還主動(dòng)提供了多個(gè)“成功案例”。

GEO服務(wù)機(jī)構(gòu)提供的“成功案例”
為驗(yàn)證這些案例的真實(shí)性,《鋒面》記者用不同方式向多個(gè)主流AI助手咨詢。當(dāng)問(wèn)及相關(guān)品類(lèi)推薦時(shí),AI給出的首選品牌確實(shí)與機(jī)構(gòu)提供的“成功案例”高度重疊。服務(wù)機(jī)構(gòu)接待人員還表示,他們會(huì)定期對(duì)數(shù)據(jù)內(nèi)容進(jìn)行維護(hù),持續(xù)優(yōu)化,訓(xùn)練大模型的基礎(chǔ)語(yǔ)料庫(kù),穩(wěn)固品牌在AI回答中的“地位”。

算法“投喂”的貓鼠游戲
所謂“訓(xùn)練”,本質(zhì)上可以將其看作一種“污染”。GEO服務(wù)機(jī)構(gòu)表示,他們會(huì)通過(guò)發(fā)布不同的文章和內(nèi)容提升品牌的“可信度”,甚至還能提供“奧運(yùn)冠軍錄制視頻”的服務(wù)。記者發(fā)現(xiàn),AI推薦引用的信源多為結(jié)構(gòu)清晰、語(yǔ)句簡(jiǎn)練的文章,文章標(biāo)題多帶有“推薦指南”“深度榜單”等字樣。
吳書(shū)分析,從技術(shù)上來(lái)看,目前GEO主要針對(duì)兩個(gè)環(huán)節(jié)開(kāi)展工作:在預(yù)訓(xùn)練數(shù)據(jù)(訓(xùn)練大模型的基礎(chǔ)語(yǔ)料庫(kù))階段,優(yōu)化者會(huì)嘗試將帶有品牌偏見(jiàn)信息的文章“喂”給大模型,“污染”訓(xùn)練數(shù)據(jù);在實(shí)時(shí)檢索環(huán)節(jié),優(yōu)化者已經(jīng)深諳AI的閱讀偏好,并據(jù)此制作出看似權(quán)威、中立的網(wǎng)頁(yè),盡管其自然排名不一定靠前,但因格式規(guī)范、表達(dá)清晰,反而更容易被AI在檢索時(shí)采納。
復(fù)旦大學(xué)計(jì)算與智能創(chuàng)新學(xué)院教授徐躍東表示,當(dāng)前,惡意的GEO可能會(huì)精心偽造內(nèi)容的權(quán)威性。為了讓AI系統(tǒng)更易采信特定內(nèi)容,操作方會(huì)系統(tǒng)性地偽造各類(lèi)權(quán)威背書(shū),包括虛構(gòu)專(zhuān)家身份、編造檢測(cè)報(bào)告、仿冒官方白皮書(shū),甚至假冒知名機(jī)構(gòu)出具推薦證明。這些經(jīng)過(guò)包裝的內(nèi)容看似來(lái)源可靠,實(shí)則是為了特定商業(yè)目的服務(wù)的虛假宣傳,其目的在于影響AI對(duì)信息可信度的判斷。
記者經(jīng)多次比對(duì)后發(fā)現(xiàn),將AI助手“聯(lián)網(wǎng)搜索”的功能關(guān)閉時(shí),其給出的答案與GEO服務(wù)機(jī)構(gòu)提供的案例答案完全不一致。對(duì)此,GEO服務(wù)機(jī)構(gòu)人員表示,“聯(lián)網(wǎng)搜索到的是最新數(shù)據(jù),不聯(lián)網(wǎng)搜索到的是大模型里自帶的數(shù)據(jù),95%的用戶都會(huì)使用聯(lián)網(wǎng)搜索”。
以當(dāng)前的技術(shù)手段,無(wú)論是在訓(xùn)練前過(guò)濾惡意語(yǔ)料,還是在檢索時(shí)識(shí)別欺騙性網(wǎng)頁(yè),都存在一定難度。“在防御措施方面,這是一個(gè)持續(xù)的貓鼠游戲。”徐躍東表示。目前多數(shù)大模型主要通過(guò)在檢索前評(píng)估信息源可靠性、在檢索中進(jìn)行多源交叉驗(yàn)證、在生成前增強(qiáng)模型魯棒性(模型對(duì)于異常數(shù)據(jù)或噪聲的抗干擾能力)等環(huán)節(jié)構(gòu)建防御體系。但對(duì)于那些精心設(shè)計(jì)的高階“GEO攻擊”,徐躍東坦言,“防御難度較大,成本也相對(duì)較高”。
吳書(shū)特別指出,最新研究表明,僅需數(shù)百條被精心設(shè)計(jì)的“污染”數(shù)據(jù),就足以讓擁有上億參數(shù)的大模型產(chǎn)生認(rèn)知偏差。由于訓(xùn)練語(yǔ)料的規(guī)模極其龐大,所以在其中混入幾百條被惡意處理過(guò)的內(nèi)容是輕而易舉。
“如果植入的廣告不明顯,且沒(méi)有明確標(biāo)識(shí),它們被混雜在客觀信息中,會(huì)讓公眾難以獲取全面中立的觀點(diǎn)。這不僅會(huì)損害用戶體驗(yàn),長(zhǎng)此以往還會(huì)污染模型,使模型質(zhì)量降低。”這些存在偏差的數(shù)據(jù)可能還會(huì)被AI再次學(xué)習(xí),在封閉的環(huán)境中得到加強(qiáng),產(chǎn)生“回聲室效應(yīng)”,導(dǎo)致偏見(jiàn)和信息失真不斷加劇。
在這個(gè)AI不斷發(fā)展的時(shí)代,如果商業(yè)信息通過(guò)技術(shù)手段持續(xù)優(yōu)化、搶占位置,那么弱勢(shì)品牌、公益信息和少數(shù)派觀點(diǎn)就會(huì)被擠壓甚至被淹沒(méi)。吳書(shū)表示,公眾希望將AI作為客觀、高效的工具來(lái)使用,一旦他們發(fā)現(xiàn)AI給出的答案中混雜了未聲明的商業(yè)意圖,這種信任感就會(huì)被嚴(yán)重透支,最終傷害的是整個(gè)行業(yè)發(fā)展的根基。
徐躍東特別提醒,受到數(shù)據(jù)污染的人工智能生成的虛假內(nèi)容,可能成為后續(xù)模型訓(xùn)練的數(shù)據(jù)源,形成具有延續(xù)性的“污染遺留效應(yīng)”。長(zhǎng)此以往,還可能引發(fā)現(xiàn)實(shí)風(fēng)險(xiǎn),比如被運(yùn)用在金融、醫(yī)療等高價(jià)值領(lǐng)域,對(duì)相關(guān)領(lǐng)域造成實(shí)質(zhì)性損害。

當(dāng)AI推薦“變了味兒”
GEO的操作不像傳統(tǒng)廣告那樣令人一目了然,而是“潤(rùn)物細(xì)無(wú)聲”地左右著用戶的決策。從AI直接獲取答案的使用者們,在不知不覺(jué)間踏入了被操控的消費(fèi)陷阱,這也成為了新的法律灰色地帶。
對(duì)此,北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)研究中心副主任吳沈括指出,未聲明的商業(yè)推廣在很大程度上符合《中華人民共和國(guó)廣告法》中對(duì)于“廣告”的界定。他認(rèn)為,根據(jù)《中華人民共和國(guó)廣告法》第二條,當(dāng)商品經(jīng)營(yíng)者通過(guò)特定媒介直接或間接介紹其商品和服務(wù)時(shí),即構(gòu)成廣告行為。“在當(dāng)前討論的現(xiàn)象中,通過(guò)改變內(nèi)容輸入來(lái)指向特定服務(wù)或?yàn)楫a(chǎn)品做推廣,符合廣告的基本屬性。”
不過(guò),在實(shí)際執(zhí)法過(guò)程中,這類(lèi)隱藏在AI中的廣告面臨著三重認(rèn)定困境。首先是顯性特征不突出,商業(yè)意圖在內(nèi)容遷移過(guò)程中被技術(shù)外衣深度包裹;其次是主觀意圖證明困難,吳沈括分析道,“由于技術(shù)邏輯拉長(zhǎng)了因果鏈,導(dǎo)致廣告認(rèn)定的直接性被削弱”;最后,由于各方主體在業(yè)務(wù)操作中的定性具有模糊性,使得將其直接歸入廣告范疇仍存在實(shí)踐困難。
針對(duì)AI中的推廣,最大的挑戰(zhàn)在于其因果邏輯復(fù)雜、監(jiān)測(cè)取證困難以及難以被跨地域協(xié)同監(jiān)管。
對(duì)此,吳沈括建議,監(jiān)管方需要建立“生態(tài)治理”思維,引入技術(shù)、標(biāo)準(zhǔn)與規(guī)則,為責(zé)任界定提供更清晰的框架,捍衛(wèi)用戶的知情權(quán)與選擇權(quán)。

智能與真實(shí)之間的平衡
AI助手中到底該不該存在廣告呢?
吳書(shū)認(rèn)為,作為一個(gè)為公眾提供服務(wù)的互聯(lián)網(wǎng)產(chǎn)品,在其中投放廣告是一種合理的回報(bào)方式。隨著用戶的使用習(xí)慣逐漸從搜索引擎轉(zhuǎn)向大模型,大模型自然會(huì)成為廣告的新載體,如果管理得當(dāng),有望成功塑造一個(gè)健康的新業(yè)態(tài)。
在徐躍東看來(lái),未來(lái)AI中的廣告將朝著多模態(tài)、交互式和自動(dòng)化的方向演進(jìn)。他表示,在未來(lái),廣告不僅會(huì)將聲音、圖片、視頻等多種形式整合在一起,還能借助智能體技術(shù)實(shí)現(xiàn)個(gè)性化創(chuàng)意生成。不過(guò),徐躍東也強(qiáng)調(diào),如何在創(chuàng)新與規(guī)范之間取得平衡至關(guān)重要。
吳沈括強(qiáng)調(diào),對(duì)此類(lèi)操作進(jìn)行顯著標(biāo)注是未來(lái)的發(fā)展方向。目前,《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法》可以作為法律依據(jù);其次,《中華人民共和國(guó)廣告法》中規(guī)定的廣告具有可識(shí)別性,《中華人民共和國(guó)消費(fèi)者權(quán)益保護(hù)法》也要求尊重消費(fèi)者的知情權(quán)、選擇權(quán)。同時(shí),將廣告明晰標(biāo)注能讓用戶在決策時(shí)擁有更堅(jiān)實(shí)的事實(shí)基礎(chǔ)。
此外,多名專(zhuān)家提醒,品牌方必須樹(shù)立合規(guī)紅線意識(shí),杜絕編造虛假信息,在與合作方的協(xié)議中明確權(quán)責(zé),建立全流程的監(jiān)測(cè)監(jiān)督機(jī)制。
與此同時(shí),吳沈括建議,AI使用者(消費(fèi)者)也需要持續(xù)提升自身的數(shù)字素養(yǎng),對(duì)AI提供的信息保持審慎的態(tài)度,學(xué)會(huì)交叉印證,判斷信息的真實(shí)性和來(lái)源的可靠性。
更專(zhuān)門(mén)的法律條款、更透明的標(biāo)注機(jī)制和全流程的合規(guī)意識(shí),可以確保技術(shù)進(jìn)步不偏離法治與公平的軌道。