您的位置 首頁 科技

Pinterest 是如何建立起矽谷最強演算法之一的

標題:Pinterest 是如何建立起矽谷最強演算法之一的

Pinterest 是如何建立起矽谷最強演算法之一的

本文來自 36 氪旗下編譯團隊神譯局,譯者 Yoyo_J,愛范兒經授權發布。

2010 年,Pinterest 誕生於美國加州名字來源於 Pin (圖釘)+Interest (興趣)。其豐富多彩的圖片內容深得用戶喜愛,尤其是年輕女性群體。成立 9 年以來,不斷引發爭議,又不斷改進。如今,Pinterest 已坐擁近 3 億月活用戶,作為圖片社交的領頭羊,Pinterest 是如何構建其強大演算法的呢?本文用這些年來的歷程給出了答案。文章譯自 Medium,作者 Will Oremus,原文標題為 How Pinterest Built One of Silicon Valley』s Most Successful Algorithms。

2010 年,Pinterest 誕生於美國加州,名字來源於 Pin (圖釘)+Interest (興趣)。其豐富多彩的圖片內容深得用戶喜愛,尤其是年輕女性群體。成立 9 年以來,不斷引發爭議,又不斷改進。如今,Pinterest 已坐擁近 3 億月活用戶,作為圖片社交的領頭羊,Pinterest 是如何構建其強大演算法的呢?本文用這些年來的歷程給出了答案。文章譯自 Medium,作者 Will Oremus,原文標題為 How Pinterest Built One of Silicon Valley』s Most Successful Algorithms。

Pinterest 是如何建立起矽谷最強演算法之一的

與大多數社交網路一樣,Pinterest 也建立在假設和偏見之上。但與大多數社交網路不同的是,Pinterest 承認這一點。(註:Pinterest 是一個圖片社交平台,採用瀑布流的形式展現圖片內容,無需用戶翻頁,新的圖片不斷自動載入在頁面底端,讓用戶不斷的發現新的圖片,堪稱圖片版 Twitter。)

從一開始,你就告訴了 Pinterest 你的簡要情況。當你註冊時,會被詢問兩個個人問題 —— 你的年齡和性別 —— 以及你如何回答它們,這將影響接下來發生的一切。根據你的回答,以及你的語言、地區和瀏覽歷史,Pinterest 會選擇一系列它認為你可能感興趣的主題類別,並要求你也選擇至少五個。

告訴 Pinterest 你是一個三十多歲的女人,你提供的興趣包括「化妝」、「美髮教程」、「鍛煉計劃」和「晚餐食譜」;告訴它你是一個三十多歲的男人,你會得到一些非常不同的選項:「木工」、「有趣的圖片」、「生存技能」和「遊戲」。或者你也可以在「非二進位」選項中輸入你自己的回答 —— 它允許你輸入任何東西 —— 你會得到一堆性別中立的選項,比如「動物」、「家居裝飾」、「女性髮型」、「男性髮型」和「香煙」。

一旦你做出了選擇,Pinterest 的機器學習軟體就會製作一個滿是圖像,或者說「圖釘」(Pin)的主頁,並預測這些會吸引你。這是一個關鍵時刻:Pinterest 內部數據顯示,如果人們看到這些「圖釘」是他們喜歡的,很有可能他們會成為活躍用戶,定期回到網站尋找與他們興趣相關的新鮮內容,查看針對這些興趣定製的廣告,並管理他們自己相關「圖釘」的圖板(Board)。如果人們第一眼找不到他們感興趣的東西,他們可能就再也不會回來了。

對於每年加入 Pinterest 的 5000 萬新用戶來說,註冊過程是矽谷最成功、但審查最少的演算法之一的初次體驗。驅動 Pinterest 主頁推送、搜索結果和通知的代碼決定了用戶在每一輪會看到什麼圖片和想法,類似於支撐 Facebook 新聞推送、YouTube 推薦或 TikTok「For You」頁面的代碼。這是一家市值 150 億美元的公司的核心產品,該公司今年成功上市,是 Uber、Lyft 和 Slack 等科技獨角獸公司中唯一一家股價一直高於 IPO 價格的公司

然而,在幕後,Pinterest 的工程師和高管們正竭力應對在其他地方造成麻煩的同樣緊張的局面。該公司領導們表示,他們希望在矽谷開闢一條不同的成功之路,一條不那麼耀眼、更人性化的道路。但在上市的第一年,它就面臨著一個關鍵的挑戰:如何在不疏遠忠實用戶和對新來者定型,也不讓錯誤信息傳播和激進化的情況下,超越一直以來偏向白人郊區女性用戶基礎?

公司正在推出一項新功能,旨在解決其演算法最明顯的缺陷:傾向於從用戶過去的行為中得出錯誤的結論。

公司正在推出一項新功能,旨在解決其演算法最明顯的缺陷:傾向於從用戶過去的行為中得出錯誤的結論。

周二,該公司將推出一個功能旨在解決其演算法中也許是最明顯的缺陷,即傾向於從用戶過去的行為中得出錯誤的結論,用他們不想再看到的東西污染內容推送 —— 比如為解除婚約的用戶推送婚紗,或者為流產的用戶推送育兒室裝飾。Pinterest 將這項功能稱為 Home Feed Tuner(主頁推送調諧器),它允許用戶查看並手動編輯他們的活動歷史和興趣,本質上是告訴演算法該記住什麼,以及該忘記什麼。

Pinterest 希望這一功能能減少投訴,提高一小部分高級用戶的滿意度。但這對網站的擴張幾乎沒有幫助,甚至可能通過限制演算法可獲得的信息而導致降低用戶的參與度。公司表示願意做出這種取捨,尤其是在早期測試顯示用戶活動沒有明顯下降的情況下。

然而,事實證明,其他的折衷方式更加棘手,比如如何深入了解用戶,讓他們繼續關注更多內容,同時又不讓他們感到厭煩、限制他們,或者讓他們離開。

用戶不想被歸類,」該公司的包容和多樣性主管坎迪斯・摩根 (Candice Morgan) 說。今年早些時候,她受委託進行了一項研究,以了解 Pinterest 如何更好地服務於那些來自平台無法代表其背景的用戶。她補充道:「他們不想讓我們根據他們的人口結構來猜測他們會喜歡什麼。」

然而,至少在註冊后的最初幾分鐘,Pinterest 的確會根據用戶的人口統計猜測他們會喜歡什麼。如果沒有這麼做,部分用戶會認為 Pinterest 不適合他們。

此外,還有一些問題困擾著一些知名度更高的社交網路病毒式的錯誤信息,激進化、攻擊性圖片和表情包,垃圾信息,以及試圖利用演算法牟利的可疑網站,所有這些都是 Pinterest 在某種程度上要處理的問題。在這方面,該公司採取了不同於競爭對手平台的方式: 接受偏見,限制病毒式傳播,成為某種意義上的反社交網路

到目前為止,一切順利。

2010 年,山景城黑客道場 (Dojo) 的三名年輕男性技術工人創立了 Pinterest,一開始,它很難成為一個分享圖片集合的大眾平台。來自愛荷華州的聯合創始人本・西爾伯曼 (Ben Silbermann) 參加了一個由女性博客作者和有影響力的人參加的會議,她們很快就喜歡上了 Pinterest。這個網站女性和郊區居民之間迅速發展,他們發現它是分享食譜、時尚竅門、DIY 項目以及家居裝飾想法的理想場所。

這些早期用戶塑造了網站的發展軌跡。該公司工程師們遵循社交媒體模板,開發了從用戶行為中學習的個性演算法軟體吸收的正是用戶的興趣和活動模式。但是過度依賴這些早期用戶生成的特定數據導致了一些問題。例如,你可能會偶然發現滿是全白色婚紗的圖板。

最初,主頁推送顯示了來自所有用戶的各種最受歡迎的「圖釘」,這些「圖釘」是根據用戶關注的圖板設計的,這對於吸引志同道合的新用戶來說是完美的,但對於發散網站的吸引力來說卻不是。摩根說:「男性有一種誤解,認為 Pinterest 只是女性用來愛美的工具,儘管其中很多內容是中性的。」

用戶是否希望主動提供更多關於自己的信息以增加個性化?我們發現答案是否定的 —— 他們只是想讓產品適用於所有人。」

用戶是否希望主動提供更多關於自己的信息以增加個性化?我們發現答案是否定的 —— 他們只是想讓產品適用於所有人。」

多年來,Pinterest 不得不重新設計系統,重新訓練演算法,以便更好地識別和定位不同類型的用戶,並繪製他們的興趣圖譜。因此,你註冊時的性別問題、讓演算法初步了解你感興趣內容的主題選擇器、以及可能有些冒昧使用瀏覽器數據 (儘管這是行業標準),這些數據可以告訴 Pinterest 你是否曾經訪問過該網站,以及你是如何來到這個網站的。

例如,關於語言和地區的問題幫助 Pinterest 接觸到了美國以外的受眾,這些人之前曾抱怨說,這個平台「從他們註冊的那一刻起就感覺很陌生」。Pinterest 現在有一半以上的用戶來自美國以外,這與其他類似規模的社交網路是一致的。在某種程度上,這些用戶為 Pinterest 開闢了一條更具包容性的道路:例如,該公司報告稱,在日本,男性在首次訪問該網站后成為活躍用戶的可能性與女性相當。

但是,將用戶劃分為更細的子群也有風險,特別是對於那些在網站上一直代表性不足的組。內部數據可能會告訴你,用一堆男性化的圖片來歡迎男性用戶可以提高激活率,但它可能不會告訴你的是,有一部分男性用戶對這種含蓄的假設不感興趣,甚至覺得被冒犯了,因為他們喜歡「猿人洞」或全是女性「漂亮名人」的圖片

Pinterest 正在研究如何幫助用戶產品中看到自己。今年 1 月,該公司推出了由摩根和奧馬爾・西耶爾 (Omar Seyal) 領導的多元化項目推出的首批產品之一。

根據該公司的研究,這是出色的第一步,但並不完美。「我們想知道,用戶是否願意主動提供更多關於自己的信息,以增加個性化?我們發現答案是否定的 —— 他們只是想讓產品適用於所有人。」摩根說。

Pinterest 從來沒有像 Twitter 和 Facebook 那樣受到媒體的密切關注,但這並不意味著它可以避免在其他地方引發醜聞的問題。其中一個著名的批評者是邁克・考爾菲德(Mike Caulfield),他是華盛頓州立大學溫哥華分校的媒介素養和網路傳播專家。2017 年,他在 Pinterest 上尋找政治文化,結果發現的東西和你在其他社交平台上看到的一樣醜陋,有一些圖板上充斥著假新聞、種族偏見和匿名者 Q 陰謀論。

考菲爾德認為,Pinterest 激進的推薦演算法,加上它對用戶創建的相關圖片圖板的依賴,可以在幾分鐘內把用戶的推送變成一個充滿仇恨的污水坑。考爾菲德寫道:「瀏覽網頁 14 分鐘后,對疫苗有一些疑問的新用戶可以從 『如何做完美的雞蛋』 的圖釘轉移到相關信息之外的東西上。」

米德爾伯里學院的艾米・柯里爾 (Amy Collier) 解釋說,部分問題在於,垃圾信息發布者利用 Pinterest 的演算法,將病毒式政治圖片與他們想出售的 T 恤放在同一個圖板上。當用戶與這些圖片進行互動時,演算法會根據相同的理論向他們顯示同一圖板上的其他項目,因為他們可能也會對此感興趣。最終,它向他們顯示了 T 恤,其中有一部分人購買了 T 恤,而垃圾信息發布者則從中獲利。

考爾菲爾德說,他已經習慣了科技公司無視他的批評,或者採取保守態度。因此,Pinterest 的反應讓他感到意外:他們感謝他強調了這個問題,並邀請他與公司高管會面,分享解決問題的想法。然後,至少在 anti-vaxx(反對接種疫苗)問題上,他們堅持了下來。

今年 8 月,Pinterest 改變了其搜索引擎處理疫苗查詢的方式。Pinterest 表示,它將只顯示來自 WHO(世界衛生組織)和 CDC (美國疾病控制與預防中心) 等主要衛生組織的「圖釘」,而不是最流行的疫苗相關「圖釘」。考菲爾德對該公司的這一舉動表示讚賞,與其他大多數平台相比,這是一種更為堅定的立場。這表明,該公司願意改寫自己的軟體,來解決單靠演算法無法解決的系統問題。

對於一個擁有 3 億用戶平台來說,這種方法能在多大程度上解決所有其他問題還有待觀察。但 Pinterest 似乎願意找出答案。

事實是,科技公司無法做地球上的所有事情。」

事實是,科技公司無法做地球上的所有事情。」

社交媒體公司的傳統觀點是,你不能把太多的責任放在用戶身上,讓他們個性化自己的內容。通過建立一個比用戶自己更了解他們可能會點擊什麼內容的新聞推送演算法,Facebook 近乎上升到全球主導地位。多年來,Instagram 和 Twitter 一直抵制演算法推送,但最終都接受了自動化,用戶基礎和財務狀況都出現了增長。你採取的每項操作都會進一步改善參與度優化機器,讓用戶自己使用這一槓桿只會增加工作量。

和其他社交平台一樣,Pinterest 也會根據月度活躍用戶和激活率等指標來判斷自己的價值。從歷史上看,它的演算法一直在不斷打磨給用戶推送的內容,向他們展示越來越多他們過去參與過的內容。對於這類事有一些常見的批評:優化用戶的參與度可能會導致用戶盲目或上癮地滾動頁面,還可能讓用戶陷入充斥著錯誤信息 (或更糟) 的過濾氣泡中。

但如果優化用戶參與度不是你的終極目標呢?這是其他一些社交網路,如 Facebook 和 Twitter 最近開始提出的問題,因為它們都分別具有更高的定性目標,比如「合理使用時間」和「健康的對話」。Pinterest 的核心產品負責人西耶爾說,這為公司本周推出的新功能鋪平了道路。

西耶爾說,多年來,Pinterest 用戶最常抱怨的問題之一是,他們無法控制其演算法顯示的內容。「你點擊某個東西,你的整個推送就變成了那個。」問題是如何在不影響演算法效率的情況下解決這個問題。「每個運營在線平台推送的人都會說,『哦,是的,我們試圖讓它更可控。但當我們試圖推出它的時候,卻失去了最高參與度。』」

最後,西耶爾說,他認為這個問題完全錯誤。相反,他告訴負責解決用戶控制問題的工程師們不必擔心用戶參與的影響,他們唯一的工作就是找到一個解決方案,以減少用戶對推送內容矯枉過正的抱怨。

這個項目的結果是「調整你的主頁推送」,它已經對一些用戶可用。在允許用戶調整演算法如何響應他們的每個操作時,Pinterest 將提供一定程度的定製化服務,而很少有人願意採用。但是西耶爾說,在測試中很明顯,這些用戶與那些抱怨的用戶有很大重疊。他們也是 Pinterest 最忠實的粉絲,而且畢竟測試尚未顯示出對參與度的任何重大影響。

現在,西耶爾認為這是一個教訓。「這是在呼籲其他平台向他們的用戶開放。這是一個棘手的問題,但人們越來越渴望獲得好的解決方案。」

Pinterest 正在賦予用戶更多的控制權,但就像任何依賴於演算法驅動推薦的社交網路一樣,它最終依賴於一種偏見。與其他同行不同,Pinterest 歡迎它 —— 只要它是合適的。

「我們終究是一個用戶生成內容的平台,」西耶爾說。「我們無法理解其中的每件事。我們網站里確實有垃圾信息散布者,確實有想要利用這個平台散布負面內容的人,並且有些是對抗性的。」

他說,為了緩解這些問題,該公司可以做的是,仔細研究其系統傾向於放大的內容類型,並調整演算法的參數,使某些內容優先於其他內容。

例如,Pinterest 的演算法把「保存」一個給定的「圖釘」作為一個比點擊強得多的積極信號。「人們不會真的保存一篇關於總統的煽動性文章,但他們會保存一套他們將來想買的衣服。所以我們傾向於這種類型的互動,而不是與好友互動。」

社交媒體網站來說,迴避好友間的互動似乎是一種奇怪的做法。但 Pinterest 表示,這是該公司緩解騷擾和病毒式宣傳等問題的方式之一。「最終,我們不會像其他平台那樣看到虛假信息宣傳,因為演算法根本不會對其有回報。」Pinterest 產品溝通主管馬洛里・盧西克 (Malorie Lucich) 表示:「當你試圖大量發送垃圾信息或迷惑人們時,你可能希望那些內容出現在 『首頁』 上,而這在 Pinterest 上是不太容易發生的。」

即使在點擊類別中,該公司軟體也將對優質網站的點擊視為比對其他網站的點擊更有價值。西耶爾說,每當 Pinterest 測試演算法的變化時,它就會關注這種變化如何影響知名網站人工選擇索引的站外流量,這些索引集中於生活方式,時尚和家庭裝飾等主題。(儘管 Facebook 試圖通過調查用戶來建立「可信來源」,但 Pinterest 承認它依賴老式的、主觀的、人工的判斷。) 如果這種變化向這些站點發送的流量更少,而更多向其他站點發送流量,那麼產品團隊將研究原因。這可能也是一個跡象,表明這一變化為一些信譽較差的網站開闢了漏洞,使它們得以利用這一演算法

所有主要的社交平台都會有意修改軟體,不管它們承認與否。澤奈普・圖費克奇(Zeynep Tufekci)等批評者提出了一個有說服力的理由,他們認為社交媒體的許多問題源於他們不願承認演算法中的基本偏見:不是支持自由政治,也不是支持保守政治,而是眼球 —— 越來越多的眼球。

像 Google,Amazon,Facebook 和 Uber 這樣的公司以勃勃的野心和看似無限的增長而聞名。西耶爾說,Pinterest 也有偉大的想法。「我們可以在我們所做的事情上做得更好:新格式、新類型的交互,而不只是 『圖釘』」。他認為,Pinterest 未來的演算法不僅要反映用戶的品味和風格,還要像頂級時尚品牌那樣幫助用戶塑造那些品味和風格。他以 Spotify 的人工播放列表為榜樣,比如頗具影響力的 RapCaviar。(註:Spotify 是一個起源於瑞典的音樂串流服務,是全球最大的串流音樂服務商,RapCaviar 可以說是 Spotify 上一個引領著 Hip-Hop 音樂風向的榜單。)

但隨後他停頓了一下,又回過頭來。他說,Pinterest 成長的關鍵是要記住自己的局限性。「我想我們只想做好能做好的事情。如果你想讓每個用戶每時每刻都花在你的產品上,那麼你就缺乏謙遜。事實是,科技公司不可能做地球上的所有事情。」

關於作者: admin

熱門文章

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *