時間:2024-02-22 10:30:35來源:三界逆熵實驗室
而就在2月16日,OpenAI宣布推出全新的人工智能模型“Sora”。據(jù)了解,通過文本指令,Sora可以直接輸出長達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個角色。
這是繼文本、圖像之后,OpenAI將其先進(jìn)的AI技術(shù)拓展到了視頻領(lǐng)域。Sora無疑是人工智能領(lǐng)域的一次重大突破,該技術(shù)不僅展示了AI在理解和創(chuàng)造復(fù)雜視覺內(nèi)容方面的先進(jìn)能力,而且對內(nèi)容創(chuàng)作、娛樂和影視制作行業(yè)帶來了前所未有的挑戰(zhàn)和機(jī)遇。
一次性看完Sora發(fā)布的所有精彩視頻
01
對Sora問世的本源思考
我們知道,人類通過獲取和識別自然界和社會的各種信息來辨別物體,從而認(rèn)知并改變世界。信息廣泛指人類社會傳播的各種內(nèi)容,包括音訊、消息以及通訊系統(tǒng)傳輸和處理的對象。這些信息以多種載體形式存在,如文字、符號、表格、聲音、圖形圖像、視頻和動畫等。
然而,現(xiàn)在,Sora的出現(xiàn)意味著對現(xiàn)實世界的理解、模擬和生成不再局限于人類。它涵蓋了文字、圖形圖片、語音和視頻等形式,而過去這些只有人類才能完成。正因如此,Sora的問世預(yù)示著這個世界正在發(fā)生難以想象的變革。
02
大模型的核心技術(shù):機(jī)器學(xué)習(xí)
大模型的核心技術(shù)是自然語言處理(NLP)和深度學(xué)習(xí)。具體而言,它基于Transformer架構(gòu),使用了大規(guī)模無監(jiān)督學(xué)習(xí)方法,例如自回歸語言建模和掩碼語言建模,來訓(xùn)練一個龐大的神經(jīng)網(wǎng)絡(luò)模型。
機(jī)器學(xué)習(xí)聽起來很高大上,其本身也確實很復(fù)雜。為了將簡單問題復(fù)雜化,機(jī)器學(xué)習(xí)是模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,如果我們從人類的學(xué)習(xí)行為來理解機(jī)器學(xué)習(xí),也許就比較容易。
人在認(rèn)識世界和學(xué)習(xí)的過程中,通常會先學(xué)習(xí)抽象的概念入手來了解某個事物或原理,這個概念其實就是對應(yīng)機(jī)器學(xué)習(xí)的特征工程。比如我們在學(xué)習(xí)幾何指示的三角形,首先會從符號來認(rèn)識,然后是了解三角形的定義、性質(zhì)和計算公式。三角形的定義、性質(zhì)和計算公式,對應(yīng)機(jī)器學(xué)習(xí)的特征工程。
通常老師在講完課程后,會留一些課后作業(yè)和家庭作業(yè),用以加深和鞏固學(xué)生對三角形的概念、定義、性質(zhì)和計算公司的理解。那么學(xué)生做作業(yè)的過程,就是機(jī)器學(xué)習(xí)的訓(xùn)練樣本。訓(xùn)練數(shù)據(jù)是用來幫助機(jī)器學(xué)習(xí)知識、建立起蘊含知識的模型的數(shù)據(jù)。
為了更好地提升學(xué)習(xí)效果和學(xué)習(xí)成績,學(xué)生還會參加課外補(bǔ)習(xí)班,然后做各種刷題和模擬練習(xí),這個過程就是讓機(jī)器學(xué)習(xí)的有更多的和更有效的訓(xùn)練樣本。在每個學(xué)期中,學(xué)校通常都會安排周考、月考、期中考、期末考,用以檢驗學(xué)生的學(xué)習(xí)效果并作為考核的依據(jù),最終的結(jié)果就是考上好的高中和好的大學(xué)。
學(xué)生參加各種考試就是對應(yīng)機(jī)器學(xué)習(xí)的測試樣本。測試樣本是機(jī)器學(xué)習(xí)里模型服務(wù)的對象,對測試數(shù)據(jù)作出正確的預(yù)測和反饋,是機(jī)器學(xué)習(xí)一系列活動的最終目的。
我們看到,計算機(jī)世界所有的技術(shù)和手段,包括機(jī)器學(xué)習(xí),都來源于我們現(xiàn)實日常生活和實踐,并且我們普通大眾都是能很好地理解。
很多時候父輩和祖輩們,可能他們沒讀過書,甚至不識字,但中華民族一些古老的知識和智慧(如成語、諺語)他們都能懂,甚至自然而然地去遵從。這些知識和智慧其實就是我們的基因,這些基因會一代代傳遞下來,并且不受文字和語言的限制。
這種基因的遺傳,其實也可以想象成一段“代碼”,假設(shè)這段代碼是更高維世界設(shè)計出來,那么人類也算是高維世界的“人工智能”。然后人類現(xiàn)又在自身的基因和日常實踐基礎(chǔ)上,設(shè)計出了第N+1代人工智能,并另類延續(xù)了人類的基因。
03
Sora會帶來哪些變局和顛覆性影響?
Sora模式的提出,必將對未來的視頻制作模式產(chǎn)生巨大的影響,并為各行各業(yè)帶來新的機(jī)遇。但Sora帶來的影響,無論從寬度和深度來說,都將遠(yuǎn)超這些。
1、對行業(yè)、職業(yè)的沖擊和顛覆
根據(jù)OpenAI官方文章介紹以及分享的演示視頻來看,Sora稱得上是“王炸級”的AI工具。就像OpenAI將圖像生成模型DALL-E集成到ChatGPT產(chǎn)品中那樣,如果OpenAI將視頻生成模型Sora也集成到ChatGPT供所有用戶使用,那么應(yīng)該能夠?qū)σ曨l相關(guān)的行業(yè)逐漸帶來改變,比如影視制作、短視頻創(chuàng)作、在線教育、廣告?zhèn)髅?、游戲開發(fā)、直播,等等。
2、虛擬現(xiàn)實融合帶來的影響
Sora模式可以按照用戶的喜好和動作,在短時間內(nèi)產(chǎn)生各種場景、情節(jié),增強(qiáng)了用戶的互動體驗。sora的問世,當(dāng)人沉浸在虛擬的元宇宙的時候,比如有AR、VR,當(dāng)體驗做到極致的時候,可能會分不清哪個是現(xiàn)實、哪個是虛擬?;蛘咧绤s不愿意區(qū)分,就像人做了美夢不愿意醒來一樣,因為虛擬世界過的可能會比現(xiàn)實世界更好。
3、數(shù)實融合驅(qū)動精神境界提升
隨著數(shù)字技術(shù)發(fā)展,人類社會活動的一切過程都有可能被記錄下來,形成數(shù)據(jù)。sora的出現(xiàn),未來可以依據(jù)價值體(如組織、企業(yè)、個人、群體的標(biāo)簽畫像、行為為記錄,可以方便地生成和還原完整現(xiàn)實世界的一切原始模型和軌跡。
也就是說,可能不需要查看攝像頭視頻,或需要畫像專家依據(jù)目擊者的描述來勾勒嫌犯的畫像,就可能直接生成相關(guān)的視頻(不只是靜態(tài)畫面)。因此,未來,你擁有多少財富、物資和房產(chǎn),在平臺里都是透明的,你所花的任何一筆錢,其實也是透明的.
這個可能導(dǎo)致的結(jié)果,隨便一筆花費別人都知道。如果是來路不正的錢,可能都不會有機(jī)會花費,違法犯罪行為也更都無法隱藏。所以,數(shù)字技術(shù)的發(fā)展,會驅(qū)使人們提升精神和道德的修養(yǎng),使得人們可能會更多地從物質(zhì)層面的追求,轉(zhuǎn)向精神層面的追求和探索。
Sora只是小試牛刀,它展現(xiàn)的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會對整個人類社會全方位帶來新的突破和變革。
04
結(jié)語
中國人常說:“六六大順、逢七必變”這句話。對于數(shù)字“七”包含著許多奧妙,例如7日來復(fù),一周有7天,7年之癢,公司7年一個坎,個人職業(yè)往往7年會有起落等等。
二十一世紀(jì)有三個7,,一個“七”已經(jīng)讓人頭痛,兩個“七”更加復(fù)雜,3個代表“多”,很多事情都可能要變,二十一世紀(jì)會是非??焖俚囊粋€時期。因此,如果再拿二十世紀(jì)的思維,有可能是行不通。比如在數(shù)字化時代,我們可以彎道超車和選擇新的路徑,而簡單地照搬西方的思想和管理模式可能行不通。當(dāng)然,這并不意味著我們之前學(xué)習(xí)和西方學(xué)習(xí)沒有必要,相反,之前的學(xué)習(xí)是非常有必要的。
Sora的出現(xiàn)是人類AI技術(shù)新的里程碑,我們在AI上暫時落后于美國,但任何事情有好有壞,AI對人類的沖擊和顛覆的后果還未最終驗證。有一種觀點,認(rèn)為所有的創(chuàng)造發(fā)明其實都是發(fā)現(xiàn),即讓人們在合適的時間“發(fā)現(xiàn)”,在我們發(fā)現(xiàn)這些規(guī)律和科學(xué)奧秘之前,它們本就一直存在和起作用。
道德經(jīng):“天網(wǎng)恢恢,疏而不失(漏)”,如果“天網(wǎng)”看成是一個看不見、摸不著的高維“數(shù)字系統(tǒng)”,天網(wǎng)和現(xiàn)實世界的對接和映射,并將現(xiàn)實世界的萬事萬物進(jìn)行了記錄和存檔。Sora的問世讓現(xiàn)實世界和數(shù)字世界連接和孿生趨向無縫連接和融合,那么天網(wǎng)系統(tǒng)、現(xiàn)實世界和數(shù)字世界三者的相互作用,又將會進(jìn)一步給我們的未來帶來更多的變化。
中國傳動網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.wangxinlc.cn)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
產(chǎn)品新聞
更多>2025-04-30
性能躍升20%!維宏NK300CX Plus數(shù)控系統(tǒng)...
2025-04-11
rpi-image-gen:樹莓派軟件鏡像構(gòu)建的終...
2025-04-08
【產(chǎn)品解讀】全面提升精密制造檢測節(jié)拍...
2025-03-31
激光閃耀 智慧引領(lǐng) | WISE MASER 黑武士...
2025-03-20