來源:量子位
隨便一張照片,就可生成3D頭像。而且光線真實,任意角度可調。
這是蘋果的最新黑科技生成框架FaceLit。
正如其名,FaceLit的特色就是可以將人臉“點亮”。
“自帶光環”的FaceLit在易用性上也不輸同類,甚至更勝一籌——
進行3D建模時,需要的照片素材無需專門選擇角度,數量上也只需一張。
甚至對表情、發型、眼鏡等元素進行調節時,也不需要額外素材。
而傳統的頭像合成工具或者需要多張圖片才能工作,或者對照片角度有刁鉆的要求。
正是憑借這一創新,FaceLit獲得了3.5的FID評分,較同類產品直接高出了25%。
山東省公共資源交易中心正式發出第一張區塊鏈中標通知書:8月9日消息,濟南繞城高速東線小許家樞紐至遙墻機場段改擴建工程房建工程施工項目的中標人收到了山東省公共資源交易中心(省政府采購中心)第一張區塊鏈中標通知書,中標人通過手機掃描中標通知書上的上鏈二維碼獲取到交易過程關鍵數據上鏈存儲憑證,憑證內容包括存證主體、文件名稱、文件大小、文件格式、文件哈希值及存證時間等相關信息,并加蓋存證主體保全印章。同時,中標人還可點擊查詢上鏈存儲證明書的上鏈信息附件,獲取存證詳細內容,包括項目名稱、項目編號、開標時間、中標人名稱、中標金額等具體交易信息,實現對交易過程關鍵數據進行查詢、驗真。(山東省公共資源交易中心)[2023/8/9 21:33:14]
改進式EG3D合成人像,光線信息單獨處理
下面就來看一下FaceLit具體是如何實現頭像合成的。
總的來說,蘋果采用了將人物本體與光線分別處理再進行疊加的策略。
東港股份開具出北京市第一張區塊鏈電子發票:東港股份公告稱:在北京市稅務局的主導下,子公司東港瑞宏提供了基于區塊鏈技術的應用和支持,于2020年3月3日開具出了北京市第一張區塊鏈電子發票。[2020/3/3]
早期的三維人像合成工具在轉換過程中可能產生形變。
而爆火的NeRF通過將場景拆分成具體因素,提高了3D圖像合成效果,改善了這一問題。
但蘋果團隊認為,在可控性方面,NeRF仍存有不足之處。
于是,在EG3D框架的基礎上,蘋果創造了FaceLit的合成模型。
EG3D通過三平面解碼器,賦予了二維卷積神經網絡生成渲染3D模型所需深度參數的能力。
蘋果團隊對標準的EG3D訓練方式進行了擴展,并將之轉化成了FaceLit框架。
聲音 | 張楠賡:烤貓失蹤唯一可查詢記錄是一張去往泰國的機票購買記錄:據騰訊新聞《潛望》消息,嘉楠董事長張楠賡接受采訪時透露,寄望于通過聯合挖礦來翻身的烤貓,在發現自己被騙之后,離奇失蹤,唯一可查詢的記錄是一張去往泰國的機票購買記錄,但至今仍下落不明。張楠賡提起烤貓的悲劇仍是一身冷汗,“因為差點被騙的就是我。”令他遺憾的是,當初騙了烤貓的那幫人,至今仍活躍在礦圈,逍遙法外。[2020/1/2]
△FaceLit與傳統EG3D渲染流程對比圖
標準的ED3G使用相機位置p參數作為基本輸入參數。
在建立GAN2操作時,蘋果在EG3D的基礎上加入了光照參數l。
不同p(左→右)與l(上→下)值下的初始圖像
蘋果選擇了經過球形諧波方式簡化后的Phong反射模型作為處理光源的物理基礎。
動態 | 云南近日開出全國第一張區塊鏈電子冠名發票:近日,在由云南省人民政府主辦的2019年首屆“數字云南”區塊鏈國際論壇上,云南省省長阮成發與騰訊副總裁、騰訊云總裁邱躍鵬一道,通過“游云南”平臺共同開出全國第一張區塊鏈電子冠名發票。這是云南省與騰訊公司將區塊鏈應用于稅務領域的一次新探索。(科技日報)[2019/8/6]
光照參數l就是在這一基礎之上獨立處理得到的。
在自然界中,反射包括鏡面反射和漫反射兩種形式。
△不同鏡面反射率條件下的效果對比
因此,蘋果在ED3G模型中加入了鏡面反射解碼器和漫反射解碼器。
它們替代了可以直接得到顏色c、密度σ數據的三平面解碼器。
動態 | Reddit用戶發起“比特幣挑戰” 一張圖片隱藏310枚BTC:在國外論壇Reddit上,一名匿名用戶于10月3日發起了一個尋找比特幣的帖子,帖子名為“比特幣挑戰(Bitcoin Challenge)”。該挑戰為一張帶有密碼的圖片。用戶宣稱,該圖片中隱藏著共計約310枚BTC(約合210萬美金),誰最先找到密鑰,就能獲得這些比特幣。 該圖下方留下的文字顯示,該用戶發起這項挑戰只是作為娛樂。據悉,在這幅圖片中,這位匿名用戶留下了4個比特幣地址,這些地址的余額分別為0.1BTC、0.2BTC、0.31BTC以及310BTC。其中310BTC地址為:39uAUwEFDi5bBbdBm5ViD8sxDBBrz7SUP4。
截至目前,余額為0.1BTC的地址的密鑰已經被找到。10月4號,一位名叫\"Lustre\"的人成功破解了這份畫中的0.1BTC地址,并轉走了其中的幣。
此前消息,今年5月,網名為u/cryptogreetings的網友發布了一張神秘圖片,為一道價值1 BTC的謎題。圖片發布之后,尚未有人能夠破解謎題。[2018/10/9]
△反射解碼器流程示意圖
通過對GAN2產生的數據進行再次解碼,可以得到鏡面反射率ks和漫反射率kd。
然后再通過兩種反射著色器得到顏色c,密度σ則由漫反射解碼器計算得出。
最終,FaceLit以與三平面解碼器相同的參數渲染圖像,并進行分辨率優化。
有的放矢設計訓練策略,數據無需人工標注
生成框架已有,那就來到訓練階段,其特點在于訓練過程中無需人工標注。
方法論層面,在訓練時,團隊使用了FFHQ、MetFaces和CelebA-HQ數據集。
對于不同的數據集,蘋果使用了不同的訓練方式。
FFHQ包含了7萬余條人臉數據,其訓練分為兩個階段:先在較低的分辨率下訓練,再提高分辨率再次進行。
對于包含2萬數據量的CelebA-HQ,訓練不需要分階段進行。
而對于更小的MetFAces,則只需要通過ADA擴容的方式,使用預訓練的FFHQ進行優化調整即可。
定性地看,訓練結果在機位、光源和反射高光等方面都有出色的表現,圖中的細節也有所增強。
△FaceLit生成的頭像唇齒部位的細節進行了明顯重構
定量結果同樣表明,FaceLit在FID、KID等指標上均優于包括標準EG3D在內的傳統生成方式。
在使用FFHQ作為訓練集的條件下,各生成方式的表現如下表,不難看出FaceLit擁有最低的FID和KID值。
而相比于英偉達的StyleGAN2,FaceLit的表現依舊出色:
光線準確度方面,FaceLit在使用三種不同訓練數據集的情況下,與人工設定的標準值平均均方誤差均低于0.01。
網友:人們低估了蘋果AI
消息發出后,便有網友認為“這是對更重磅產品的預熱”。
更有網友直接推測,FaceLit的出現標示著人工智能將進軍AR和VR領域,蘋果的混合現實將最終實現商用……
也有網友認為,FaceLit不會商用,否則蘋果才不會以論文的形式發表。
針對FaceLit本身,也有網友表示,除了LLM,其他都是浮云,他們如果不開發LLM,就沒有未來。
但這位網友同時也說,蘋果可能已經在做了。
相應的,也有網友稱人們“低估了蘋果在AI領域的深度”。
所以各位網友對蘋果在AI領域還有什么樣的期待呢?
論文地址:https://arxiv.org/abs/2303.15437
GitHub地址:https://github.com/apple/ml-facelit
參考鏈接:https://twitter.com/AlphaSignalAI/status/1648361623004774400
Tags:FACECELACELITFacebook Metaversecel幣項目官網SPACEDOGElitentry幣融資
來源:新智元編輯:Aeneas好困快速定制模型的LLM引擎Lamini來了,開發者狂喜!ChatGPT雖好,但始終有門檻。通常,只有擁有AI博士學位的大型機器學習團隊,才能這樣訓練一個模型.
1900/1/1 0:00:00出品:ThePrimediaDAO作者:Jerry@ThePrimedia,0xLeon我們已經感受到香港Web3的敘事正在OnchainRealWorldAssets.
1900/1/1 0:00:00來源|financemagnates 編譯|潮外音 區塊鏈是顛覆游戲業務的最新突破,這對創新并不陌生。通過為玩家提供游戲所有權、交易和玩游戲的新選擇,區塊鏈有能力徹底改變游戲業務.
1900/1/1 0:00:00原文來源于?Dappradar,白澤研究院編譯。因篇幅原因略有內容刪改,建議感興趣的讀者閱讀原文:隨著BoredApeYachtClub(BAYC)成立兩周年的臨近,現在正是回顧YugaLabs.
1900/1/1 0:00:00金色財經報道,以太坊聯合創始人VitalikButerin在Zuzalu核心開發演示期間宣布ETH3.0路線圖。以太坊3.0路線圖承諾對網絡進行重大升級和更改,包括引入權益證明共識機制、分片等.
1900/1/1 0:00:004月29日消息,4月28日Bankless聯合創始人DavidHoffman發布推特文章,披露了規模為3500萬美元的BanklessVentures已獲得75%的承諾投資.
1900/1/1 0:00:00