不要對三星 Galaxy S24 的人工智慧功能太興奮

不要對三星 Galaxy S24 的人工智慧功能太興奮

不要對三星 Galaxy S24 的人工智慧功能太興奮

亞瑟·盧平 / X

“行動人工智慧的新時代。” 這就是三星在全球宣傳即將推出的智慧型手機的方式。 銀河S24系列。 對於本月稍後舉行的 Unpacked 活動,該公司承諾「由人工智慧驅動的全新行動體驗」。

三星不會是第一個涉足人工智慧炒作的公司 聊天GPT中途。 高通和聯發科這兩家智慧型手機晶片巨頭最近大肆展示了其最新旗艦和中階處理器的設備端生成人工智慧功能。

這種轉變是顯而易見的。 人工智慧將成為手機的行銷流行語。 但我們究竟是為了什麼? 這些所謂的「人工智慧進步」將如何增加任何有意義的價值仍然是一個秘密。 或者它可能只是一個現有的技巧,等待以不同的名稱或本機應用程式重新包裝。

第一個知道 Galaxy S24 何時發布:

三星能否兌現承諾,否則就會慘敗

三星 Galaxy AI 預告片。
這最好不是一個噱頭,三星。 三星

我們先從 Galaxy S24 系列手機開始。 他們將與 高通 Snapdragon 8 Gen 3 晶片。 這家晶片製造商對其新頂級晶片組的生成人工智慧功能做出了一些大膽的宣稱。 例如,據說可以使用以下命令在一秒鐘內根據文字提示生成圖像 穩定擴散AI技術

高通公司提供了令人著迷的技術 解釋 關於它如何優化穩定擴散技術以實現設備上的操作。 競爭對手聯發科也聲稱其旗艦產品的設備端人工智慧技術 天璣9300 透過穩定擴散,可以在不到一秒的時間內產生文字到影像。

現在,我們已經擁有一款搭載高通最新旗艦產品的手機。 有問題的設備是 iQoo 12但有趣的是,這款手機的行銷資料並沒有提及任何生成式人工智慧技巧,尤其是高通和聯發科大肆宣傳的那種。

我該如何處理這些人工智慧生成的忍者貓圖片?

我們假設三星將成為提供文字到圖像生成功能的公司。 最終它會實現什麼目標? 目前,我們不知道文字到圖像的技巧是否會捆綁在第三方應用程式中,或者三星是否會將其整合到其應用程式之一中。

真正的問題是它將為我們的日常智慧型手機使用模式增加多少價值。 一般 Galaxy S24 買家會如何處理透過單行文字提示產生的圖片? 也許,他們會使用這些人工智慧生成的圖像來增加聊天的熱情或在社交媒體上引起轟動。

但這裡仍然存在一些摩擦。 您必須從一行文字產生這些圖像,將它們保存在本機(或直接將它們複製到剪貼簿),然後將這些 AI 圖像貼到您選擇的聊天應用程式中。 最好的解決方案是三星以某種方式將圖像到文字的生成技巧整合到鍵盤中。

高通針對手機的穩定擴散展示。
高通

再說一次,當表情符號、GIF 和貼紙都可以做到這一點時,為什麼要花那麼多麻煩呢? 此外,512 x 512 像素的輸出解析度不足以將這些 AI 產生的影像放入大學作業或工作簡報中。

此外,該系統可能不會免費。 聯發科技的示範影片提到了進階選項。 當 Galaxy S24 購物者達到一定數量的輸出時,他們可能最終會遇到文字到圖像令牌的限制,之後他們要么被降級到較慢的圖像生成速度層,要么被要求支付訂閱費。

聯發科天璣 9300:無與倫比的生成式 AI 表現 | 文字轉圖像

但如果這就是現實,那麼整個問題就沒有意義了,因為我們已經有了像這樣的解決方案 OpenAI 的 Dall-E 在那裡。 您可以免費使用它來產生圖像,也可以付費使用它 聊天GPT Plus 享受最新 Dall-E 3 型號更快、更詳細影像生成的好處。 這只是眾多文字到圖像生成器之一。

高通表示,Snapdragon 8 Gen 3 是「首款支援多模態 Gen AI 模型的處理器」。 這意味著在手機上本地運行的聊天機器人(基於 Meta 的 Llama 模型)將接受文字、圖像以及語音形式的輸入。 再說一遍,這並不是獨一無二的,因為 ChatGPT-4 已經提供了該功能,儘管需要訂閱牆。

我們真的需要它嗎?

手機上的 Snapdragon AI 助理。
高通

高通宣傳的最有前途的功能之一是人工智慧影像擴充。 本質上,你可以向任何你想要的方向擴展圖像的畫布,設備上的生成人工智慧將根據你的文字提示智慧地生成像素,並向原始框架添加更多物件。

目睹這個技巧真是太神奇了——看到圖像隨著更多物體的添加而擴大,視野也變寬,就好像一位畫家正在修飾他的作品一樣。 但您不想對在手機上單擊以將其保存為內存的圖片執行此操作。 對它們使用生成式人工智慧擴充就像用你從未真正經歷過的虛假視覺效果和場景污染你的記憶。

總結是手機上生成式人工智慧部署的另一個大賭注。 它非常適合閱讀新聞並了解不同領域的最新發展。 然而,只有在摩擦最小的情況下,這個技巧才會脫穎而出。 例如,如果使用者可以在同一瀏覽器頁面上總結新聞文章,而不用開啟另一個應用程式。

如果是後者,為什麼不直接轉向已經這樣做的應用程式呢? 例如, Artifact 是一款由 Instagram 聯合創始人 Kevin Systrom 設計的精美應用程式 使用人工智慧為您總結文章。

已經有一些應用程式和網站以摘要形式提供新聞,例如 Inshorts。 對於您的收件匣, 短波是一款非常棒的應用 它不僅可以為您總結電子郵件鏈,而且無需額外付費。

在 Shortwave 中發送電子郵件摘要
像 Shortwave 這樣的應用程式非常適合總結您的電子郵件鏈。 納迪姆·薩瓦爾 / 數字趨勢

設備上的生成人工智慧也有望實現基於語音的照片編輯等技巧。 這聽起來非常方便,但很難想像當一鍵式過濾器和精細滑桿提供同樣快速且更有價值的手機媒體編輯流程時,它會為我們的生活帶來多少便利。

接下來,讓我們轉向使用人工智慧進行一些通用聊天或獲取答案的基本情況,否則需要網路推動的研究。 我們將再次遇到定性問題。

由於資源的基本可用性,在手機上本地運行的生成式人工智慧模型(例如 Meta 的 Llama)並不是同類中最先進的。 谷歌就是你的最佳選擇。 這 Pixel 8 Pro 只運行 Google 大語言模型中最小的一種,稱為 Gemini Nano。 為什麼不跳到 ChatGPT 或 Pi 透過他們專用的行動應用程式 而不是選擇能力較差的語言模型?

生成式人工智慧真正需要的地方

AI助理與ChatGPT的比較。
納迪姆·薩瓦爾 / 數字趨勢

目前,我認為生成式人工智慧的最佳技巧是將智慧型手機任務與雲端(以及始終在線的要求)解耦,並提供額外的安全性。 但要做到這一點,這些裝置上的人工智慧技巧需要兼具助理的功能,有點像 Google Assistant、Alexa 或 Siri。

或者更好的是,他們需要成為助理的一部分。 讓你的生成人工智慧助理從你的庫中拾取所有貓的圖像,將它們編織成拼貼畫,然後將它們發送給你的爸爸。 或者,讓它規劃迪士尼樂園一日遊的最佳行程,為您找到下週末最便宜的門票,並在 Google 日曆上整齊地安排所有這些詳細資訊。

此外,如果裝置上的生成式人工智慧工具不再將您的資料推送到雲端伺服器,並將每個操作保留在您的智慧型手機本地,那麼就不用擔心資料隱私。 至少理論上是這樣。 目前,我不確定三星正在銷售的 Galaxy AI 願景,但看看三星是否能夠真正提供有意義的生成式 AI 體驗,或者只是一堆幾乎不實用的噱頭,這將是很有趣的。

猜你想看….

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端