如何用AIGC支點,撬動元宇宙生態?
來源 | 野馬財經
“被AI的繪畫技術整破防了”“AI會取代人類繪畫嗎”……這些近期掛在微博熱搜榜上的話題,揭示了AI繪畫的火爆程度。無論是自拍、合影,還是搞怪圖片,只需應用AI繪畫特效,就能一鍵轉換為自己指定風格的精美繪圖。這種開盲盒似的體驗,讓許多用戶欲罷不能。
【資料圖】
昆侖天工旗下模型包括天工巧繪SkyPaint、天工樂府SkyMusic、天工妙筆SkyText、天工智碼SkyCode,覆蓋圖像、音樂、文本、編程等多模態內容生成能力。這標志著昆侖萬維成為目前國內AIGC領域布局最為全面的公司之一,也是國內第一個全身心投入到AIGC開源社區的公司。
此時宣布開源,昆侖萬維CEO方漢表示,“因為我們堅信開源是推動AIGC生態發展的土壤和重要力量。昆侖萬維致力于在AIGC模型算法方面的技術創新和開拓,致力于推進開源AIGC算法和模型社區的發展壯大,致力于降低AIGC技術在各行各業的使用和學習門檻。”
昆侖萬維的AIGC技術到底已經發展到了什么程度?能夠將AIGC生態的發展助推到一個新高度嗎?
模型突破,AIGC爆發
“成精”的AI,不僅能繪畫,還能聊天。12月以來在科技圈刷屏的聊天機器人ChatGPT,面對網友們“調戲式”的提問,不僅對答如流,還能中英文絲滑切換,就連參加有“美國高考”之稱的SAT考試也能考出排在全美前52%的成績。
相關產品的出圈,讓AIGC概念站到了聚光燈下。國盛證券研報稱,AIGC代表新一輪范式轉移的開始,其中在AIGC生成算法模型及數據集層面,可關注英偉達、Meta、百度、藍色光標(300058.SZ)、昆侖萬維(300418.SZ)等公司。
事實上,AIGC頻繁見諸報端是今年才發生的事,這也是為何2022年被稱為AIGC元年。其是繼PGC(專業生產內容)和UGC(用戶生產內容)后的又一種新型內容創作方式,此前雖然業界對AIGC研究已久,但一直難以實現質的突破。
招商證券研報中,將AIGC的發展分為三個階段,分別是1950-1990年的早期萌芽階段、1990-2010年的沉淀積累階段和2010年至今的快速發展階段。其迭代與人工智能深度學習的演進沿革密切相關。
要了解深度學習,就離不開機器學習的概念。這項技術的主要任務是指導計算機從數據中學習,然后利用經驗來改善自身的性能。
在此基礎上,深度學習開辟了機器學習研究中的新方法。其動機在于建立、模擬人腦進行分析學習的神經網絡,模仿人腦的機制來解釋數據,是2011-2020年最熱門的AI研究主題。
最早出現的深度學習模型是2014年的GAN,其對輸出結果的控制力較弱;2021年,CLIP模型橫空出世,其已經能實現圖像和文本的匹配;而2022年的最新深度學習模型Diffusion,不僅能高效合成視覺數據,還在視頻生成、音頻合成等其他領域展示出了不俗的潛力,直接推動了AIGC技術的突破性發展。
可以說,近兩年AI深度學習的發展,是以天為單位計算的。以AI繪畫為例,其實今年年初被大眾熟知的AI繪畫產品Disco Diffusion的缺點還較為明顯,不僅無法刻畫具體細節,還要耗費數以小時計的時間對圖像進行渲染。
圖注:天工巧繪生成作品
但這些缺點僅過了幾個月就被新模型Stable Diffusion近乎完美的解決,后者可將模型的計算空間,在盡可能保留細節信息的情況下降維到一個稱之為“潛空間”的低維空間里, 再進行繁重的模型訓練和圖像生成計算,大大降低了內存和計算要求。而且這款當今堪稱最強大的AI繪畫模型,已經于8月完全開源。
這種從前只會發生在《三體》等科幻小說中的“降維打擊”情節,竟成為了現實,也難怪AIGC領域當下深受資本青睞。目前,大數據+AI公司Databricks估值已達380億美元,開發出ChatGPT的OpenAI估值在今年10月超過200億美元。同時,國內百度、騰訊、阿里巴巴、字節跳動、網易等大廠也正競相入場。
AIGC的應用場景大致可以分為To B和To C兩個賽道,其中B端主要通過“AI+”為產業進行賦能;C端主要通過與人交互進行內容生產。而招商證券又按照生成的內容形式,將AIGC分為了文字、圖像、音頻、視頻和虛擬人五類。
另據Gartner預測,至2025年人工智能生成數據占比將達10%。紅杉美國的兩位合伙人在一篇題為《Generative AI:A Creative New World》的報告中表示,AIGC有潛力產生數萬億美元的經濟價值。
AIGC走紅后,兩年前就開始對該領域進行全系列布局的昆侖萬維受到了廣泛關注。
登陸A股的2015年,昆侖萬維的游戲收入占比達97%,境外收入占比達74%,公司IPO募集的13億元也基本用于游戲的研發和代理,是一家不折不扣的海外游戲公司。
但在上市后次年,昆侖萬維就聯合三六零(601360.SH)收購了全球知名瀏覽器公司Opera,自此走上了互聯網平臺型企業的轉型之路。7年時間里,昆侖萬維一邊收購資產,一邊開發自研,目前業務已覆蓋包括社交、娛樂、元宇宙、信息分發、搜索及游戲等在內的多個領域。
同期,昆侖萬維一直堅持出海戰略。截至今年上半年,公司的兩個主要產品,Opera全球平均月活用戶達3.3億;海外社交娛樂領域頭部平臺StarX主打產品StarMaker累計在102個國家音樂/音頻類暢銷榜排名前五,其中84個國家位列第一。
事實上,早在兩年前,昆侖萬維已經開始全系列布局AIGC,投入數千萬元,組建了二百余人的研發團隊。2020年底至2021年4月,其研發出百億參數的中文GPT-3模型,并于2021年8月開始研發基于自有大文本模型的對話機器人,迅速刷新國內技術指標。2022年1月啟動SkyMusic音樂實驗室,2022年4月達到人工智能領域最優效果;2022年9月啟動編程、圖像、文本方向的AIGC產品。
目前,昆侖萬維推出的AIGC模型與算法昆侖天工,AI生成能力已覆蓋圖像、音樂、編程、文本等全模態領域,且其在四大模態領域均采用世界頂尖開源模型。
如AI圖像方面,天工巧繪采用全球第一款多語言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5億中英雙語語料,支持中英雙語輸入實現文字生成圖像,是國內為數不多的支持中英雙語的文圖生成模型。
圖注:天工巧繪生成作品
AI音樂方面,天工樂府則采用了國內第一款商用級開源作曲AI模型,和弦準確率達92.5%,遠超目前行業最佳64.7%;還支持31種語種、全球多個曲風,并能從旋律、文案素材生成歌詞。
今年上半年,StarX成立的MusicX Lab音樂實驗室發布了五首完全由AI作曲的歌曲,已在Spotify、SoundCloud、QQ音樂和網易云音樂等海內外180余個音樂平臺上線;三季度,MusicX Lab再推10首新作AI歌曲,算法模型及AIGC能力不斷優化提升。得益于此,目前StarMaker旗下K歌類產品Sing Star已是業內第一個可實現AIGC豐富內容供給的產品。
而AI編程方面,天工智碼則采用全球第一款多語言開源編程大模型,能生成python、Java、C、php、swift等共計十余種編程語言,使不同語言的使用者都能來體驗。
圖注:天工妙筆生成五言詩
不難發現,無論是哪一領域,昆侖天工都很重視多語言模型的開發、為全球的從業者和用戶造福,這也與公司出海的戰略遙相呼應。優質模型疊加豐富的數據集,讓昆侖天工擁有強大的團隊模型訓練能力,并在同賽道上市公司中處于領先地位。
值得一提的是,目前AI圖像、AI編程、AI文本的模型已經在GitHub上開源。“我們堅信開源是推動AIGC生態發展的土壤和重要力量?!狈綕h在發布會上稱。
能讓昆侖萬維如此不遺余力地押注,AIGC到底有何魔力?或許將目光放到其背后的元宇宙可以找到答案。
雖然終極形態尚未確定,但業界的共識是,元宇宙將極大擴展人類的存在空間。而這樣的空間需要大量的數字內容支撐,顯然單靠人工設計和開發無法完全滿足需求,AIGC剛好可以解決這樣一個問題。
在此背景下,AIGC被視作“推動元宇宙發展的加速器”,亦或是“開啟元宇宙的鑰匙”。結合昆侖萬維原本的元宇宙業務,AIGC或將賦予昆侖萬維更大的想象空間。
一方面,AIGC可以實現降本增效,并增強應用的可玩性和功能性。還是以AI作曲為例:昆侖萬維的游戲、StarMaker等產品中都需要植入海量音樂,而音樂本身創作成本較高,AI作曲則能在提高音樂品質的同時降低使用成本和音樂愛好者、獨立音樂人的使用門檻。
方漢曾打過這樣一個比方:“假設每款游戲的音樂成本在50萬元至100萬元之間,那么通過AIGC,我們的音樂成本就能夠降至0?!?/p>
同時,這種模式也具備商業化潛力。近期昆侖萬維方面表示,已經接到了采購AI創作歌曲的意向。目前看來,為企業用戶提供音樂相關解決方案,包括批量供給背景音樂、伴奏配樂等泛化內容,或為藝人及虛擬偶像定制化創作符合其人設調性的音樂作品等服務,是AI作曲B端落地的重要方向。
“其實全世界做AIGC的公司非常多,但是昆侖萬維的長處在于我們有音頻方面的深厚積累。我們擁有全世界最大的伴奏帶數據庫,里面有相當多是已經被數字化的伴奏母帶。人工智能非常依賴數據集,我們有這樣高質量的數據集,對于AIGC非常有幫助。這是競爭對手短期內無法復制的?!狈綕h曾表示。
不只是AI作曲,昆侖天工在AI繪畫、AI編程、AI文本方面的輸出能力,同樣能與昆侖萬維的元宇宙業務形成協同效應。再結合昆侖萬維此前在文娛、社交、游戲等不同行業的深度商業沉淀和領先的互聯網運營能力,在行業人士看來,昆侖萬維也有望成為元宇宙風口到來后最大的受益者之一。