發表文章

目前顯示的是 1月, 2024的文章

CES 2024:生成式AI成為主流,領先技術走向明確方向

本文同步刊登於: CES 2024:生成式AI成為主流,領先技術走向明確方向 - 巴哈姆特小屋 在今年的美國CES 2024展覽中,不同於去年CES 2023的主題,都籠罩、充斥在方向不夠明確的元宇宙題材當中,這回,反而更確立了一個明確的發展方向題材:生成式AI。 自OpenAI在2023年推出ChatGPT以來,這項技術引起廣泛關注。如果您認為AI的應用僅僅限於生成文本摘要、生成圖片、語音轉文字的話,那認真的來說,您可能未能全面了解AI的未來前景。 在CES 2024中,主要展示了一些與我之前撰寫的 與新冠病毒共存的未來世界:零接觸 & 元宇宙(Metaverse) 文章密切相關的應用內容,舉凡說邊緣運算。邊緣運算這技術面向消費性產品的代表就是Ai PC、Ai手機。最早橫空出世、映入眾人眼簾的邊緣運算應用自然是莫過於距今約七年前在出戰來自中國職業棋士柯潔的Alpha GO。這也是最廣為人知的第一個使用邊緣運算技術的AI晶片應用。強調其中的特點是,即使在沒有網路連接的情況下,仍然能夠實現與連網時相同的功能,例如生成文字、生成圖片、雙向翻譯、生成音樂等場景。如今,七年過去,這樣的尖端技術已經正式從企業端下放至消費端產品中佈署,而邊緣運算本身的優勢就在於延遲性低、減少等待生成內容的時間、可斷網使用等優勢。 我在前文中也提到,AI的實際應用絕不僅僅限於這些。因為我剛剛提到的,還只是結合軟硬體、雲端混合運算的生成式AI而已,這還只是一個變化的開端。像過去在科幻電影中常出現的應用,也將陸續成真,化身為消費性產品,面向於我們的日常生活。 看到這裡,讀者也許會感到好奇了,生成式AI不就是這樣子嗎?那跟西元2023年的元宇宙題材之間,又能有何種關聯性?所以我才會在一開始就寫到,那並不是真正完整的看透整個生成式AI的產業發展。那生成式AI在元宇宙生態中又會融入哪些日常應用? 像是我在該 與新冠病毒共存的未來世界:零接觸 & 元宇宙(Metaverse) 文章中有提過,生成式AI乃是元宇宙的發展生態基石、地基。也曾在文中提過,未來我們將不會有所謂語言隔閡的存在(生成式AI的翻譯系統),也有提到未來的人類將會越來越長壽(基於生成式AI技術的個人化醫療系統),還有虛實混合應用的穿戴裝置(VR、AR)、虛擬偶像(基於生成式AI的虛擬人物、Vtuber)。講到個人化醫療系統這件...

談談「使用Ai工具就不會被淘汰」背後的意思。

本文同步刊登於: 談談「使用Ai工具就不會被淘汰」背後的意思 - 巴哈姆特小屋 一句「使用Ai工具就不會被淘汰」後面帶來的想法可能是「那我只要付費使用GPT,公司也不會淘汰我了吧?」這只會產生了不正確的樂觀想法就是了,既然不會使用Ai工具的人會被淘汰,那麼也暗喻著,「跟不上未來市場需求的人,也一樣會被淘汰。」 舉例來說,「市場會飽和」就是一窩蜂的人大量湧入其中,所以才會開始有淘汰機制。因此換句話說,「凡是不能適應變化的一方,才是會被淘汰的一方」,而不存在所謂「因為今天我們使用了什麼工具,才沒有被淘汰」的說法。 像以前台灣農業社會因識字的人偏少,所以,有識字的一方除了薪資偏高外,也當然可以合理淘汰不識字的一方。而這樣的發展至今,卻只看到了學歷氾濫、路上每個都是大學畢業的求職者,那這樣也真的沒有任何人被淘汰嗎?想當然不可能會有這種理想事發生。 更具體的真實職場例子,同樣都是大學畢業的求職者,老闆還是會淘汰一批應徵者就是,所以我才會解釋說,不會有那種「今天我使用了Ai工具就會發生什麼好事」的結論。像「新創公司每年數量也都很多沒錯,但最後能成功的新創仍是少數」一樣,這兩者完全是異曲同工之妙。只能說,擁有這種觀點者建議要改一下,免得未來承受期望越高,失望反而越大的落差感。 依稀記得六年前李開復老師也只提到:「要在Ai時代更有競爭力,人必須要擁有同理心、好奇心、創造力,這是Ai所做不到的」,相比起一昧追求「學會使用Ai工具」這件事,還不如想想「整合能力」與「解決問題」這兩件事比較實際。

[動眼看] Gemini Pro模型實測:圖片推理分析 + 生成YT影片摘要 + 文件讀取(2024/02/02更新)

圖片
本文同步刊登於: [動眼看] Gemini Pro模型實測:圖片推理分析 + 生成YT影片摘要 + 文件讀取 - 巴哈姆特小屋 Gemini Ultra效果展示: 相關新聞:  GPT-4V最強對手來了,Google多模態Gemini模型登場,手機不連網也能從錄音檔摘要會議紀錄 這個技術叫做「視覺推理」(Visual Reasoning),意思就是,在不需要事先輸入好任何上下文內容、也不需要輸入任何文字內容,就可以進行預測的行為。(例如:距今約六年前爆紅全球的Alpha GO,就是使用該技術的領先佼佼者。) 而「多模態學習」(Multimodal learning),意思就是可以直接透過聽覺、視覺、語音同時運作的方式,進行資訊內容判讀與學習。(類似於人類透過人類五感進行學習的概念。) 有興趣可以去讀這二篇論文 視覺推理(Visual Reasoning),神經網路也可以有邏輯 IMAGEBIND :META 開源型多模態學習的革新之作,將 6 種感知緊密結合! 然後,這是GPT3.5對「LLM與Visual Reasoning」的技術領域解釋: GPT3.5對「Multimodal learning」的解釋: 昨晚Google發表的新模型Gemini Ai模型,已在英文版搶先上線了!透過機器視覺技術來解析4x4數獨,能力已經比過去使用的PALM2模型明顯提升不少。(降低幻想、胡言亂語的比例,目前僅支援英文語系。) 明年初逐步上線的Gemini Ultra模型,將比目前使用的Gemini Pro模型,將帶來更為強大的通用領域表現。 以下影片內容為官方使用Gemini Pro的展示: 先給出測試總結: 延伸閱讀: [動眼看] New Bing讀取SEC文本測試(在無法使用搜尋引擎的條件下) 以下則是我自己使用Gemini Pro的展示: 4x4數獨 數學題目測試:                                                          ...

[動眼看] New Bing讀取SEC文本測試(在無法使用搜尋引擎插件的條件下)

圖片
本文同步刊登於: [動眼看] New Bing讀取SEC文本測試(在無法使用搜尋引擎插件的條件下) 記得OpenAi官方也曾說過,GPT是最強的語言模型,始終強調可以理解文本、上下文對話的內容。 於是找了一份,具有完整上下文內容的SEC文本,剛試了一下New Bing(  微軟證實新版Bing就是用GPT-4,冰島政府與摩根史坦利等多家企業也正在用   ),如果是讀取SEC的PDF網址,它是可以透過搜尋達到精準回答,但也不是每一題都正確就是了,反之若是將PDF檔案下載至用戶端的電腦D槽上,透過Edge瀏覽器打開PDF文件,這時候的New Bing也就無法順利連上網路進行搜尋回答,就準確度表現上就變得跟使用Gemini Pro模型的Google Bard透過Tag Google雲端硬碟插件的效果一樣,很容易在數字答案上出現幻覺。(詳見下圖) 一共150筆SEC題目與答案(截圖來源:  PatronusAI/financebenc  ) New Bing(使用GPT-4)產生的數字幻覺 Google Bard(使用Gemini Pro模型)產生的的數字幻覺 至於文件摘要的部分,New Bing也只能摘要第一頁面的部份,無法做整篇的文本內容章節摘要。(在相同的條件比較下,使用Gemini Pro模型的Google Bard還顯得比較有優勢,因為使用ChatGPT-4模型的New Bing必須仰賴搜尋引擎插件下,才能順利完整寫出內容摘要。) New Bing文件摘要(搭載GPT-4模型,無支援搜尋引擎插件) Google Bard(使用Gemini Pro模型)生成文件摘要(無支援搜尋引擎插件) Google Bard(使用Gemini Pro模型)生成文件總結(無支援搜尋引擎插件) 所以,合理反推,ChatGPT-4若將搜尋引擎的功能插件給手動關掉,再進行SEC文件內容提問,其準確度表現也會隨之降級,幻覺程度大量提升。 延伸閱讀: ChatGPT Plus將可搜尋網際網路,但僅使用微軟Bing 所謂的最強語言模型、GPT-4感覺比較好用,認真講破了,其實就是建立在搜尋引擎的插件上而已,只要語言模型無法支援搜尋引擎去找出答案,論結果上也就強不起來。 其中最容易分辨的方式就是,直接問GPT-4、Bing該問題的答案是在該文件內容的第幾頁?...

聊聊台灣職場目前不想使用Ai或導入Ai的幾個主因

本文同步刊登於: 聊聊台灣職場目前不想使用Ai或導入Ai的幾個主因 - 巴哈姆特小屋 Q:明明AI概念股如此熱門,網路上也有眾多討論,為何在台灣職場上卻難以感受到AI的氛圍? 實際上,這個問題追溯到人為的因素,大多數人處於100%被動的狀態。主要原因如下: 員工的想法: 目前公司職場的生存法則,往往讓員工不願意積極採用AI提升效率,因為普遍存在「穩做、摸魚」的潛規則,這種想法已形成多年共識。(應試教育下的職場文化) 資本家的想法: 老闆可能認為AI技術昂貴,且未見明確、獨缺具體的實用場景,因此選擇保持現狀營運。 Q:提升工作效率會帶來什麼影響? 一旦工作效率提升,老闆們傾向增加公司工作量,直至員工無法再承擔、公司內無其他工作可安排為止,進而啟動裁員計劃。 Q:這樣的話,選擇提升工作效率是否有利? 視情況而定。若公司人員流動率高,例如頻繁離職或缺工情況,提升效率自然成為必要,同時促使員工自立自強。然而,需謹慎權衡公司狀況,避免過度工作導致不良後果。 Q:在這個AI逐漸取代人類工作的時代,我們是否能夠轉向從事全新的工作職缺呢?[div] 在台灣的職場環境中,多年來存在一個歧視性的潛規則,即「年紀輕的被認為沒有相關經驗,而年紀較大的則被擔心體力不足。」這種態度可能使得年輕人難以進入職場,同時讓有經驗的人感到被忽略。 我們是否可以思考,隨著AI技術的進步,我們可以打破這樣的潛規則,讓每個人都有機會參與到全新的工作領域中?這或許是一個機會,讓人們能夠重新定義自己在職場中的價值。舉例來說,透過學習新技能、參與跨領域的合作,我們或許能夠跳脫傳統的觀念,迎接未來多元化的工作機會。 Q:AI時代,所需要的求生技能標準是什麼? 需要同時具備:「同理心、好奇心、創造力」這三者集於一身的條件,其次才是學經歷。 好奇心 = 樂於面對問題或需求。 創造力 = 解決他人問題或需求。 同理心 = 擅於傾聽、化繁為簡。 人類進步不是因為學會使用工具,而是懂得製造工具來變現。 Q:哪一種職業並不會被Ai取代? 資本家。因為這些人所做的任何決定,基本上都會是牽一髮動全身,會直接影響整間公司的未來營運走向與獲利表現,再加上Ai發展的需求,基本上都會是以這些族群的需求為優先(同時也是新創公司能否站穩腳步成長的獲利對象),因此並不會被Ai所取代。 --------------------------...