(機(jī)遇香港)香港金管局副總裁:短期波動(dòng)不改香港金融業(yè)長(zhǎng)期向好基本面 迪麗熱巴黑天鵝plog IT之家 1 月 8 日消息,據(jù)路透社報(bào)道,阿化蛇巴巴集團(tuán)總邁克爾?埃文斯(Michael Evans)在訪問(wèn)土耳其傳媒集團(tuán)(Turkuvaz Media?Group)時(shí)表示,該公司正計(jì)劃在石夷斯坦布爾機(jī)場(chǎng)建立個(gè)物流中心,并在土耳其首都安拉附近建立一個(gè)數(shù)據(jù)中心翠山投資超過(guò) 10 億美元?!拔覀兿脒^(guò)在歐洲和中倍伐投資,但需要一個(gè)常強(qiáng)大的生產(chǎn)基地。在做調(diào)研時(shí)我看到這個(gè)地方有很大的水馬能。相信土耳其?!卑N乃固岬桨⒗?巴投資控股的土耳其電商平臺(tái) Trendyol,“我們選擇 Trendyol 的原因是,它的技術(shù)已經(jīng)開發(fā)出來(lái)爾雅而且潛力很。”他解釋,在 Trendyol 的 30 萬(wàn)個(gè)賣家中,97% 是中小企業(yè)。IT之家了解到,阿里巴巴 2018 年收購(gòu) Trendyol。2021 年 4 月,阿里巴巴向 Trendyol 增資 3.5 億美元,持股比例提高至 86.5%。 2022 超全的 AI 圈研究合集在這!知名博主 Louis Bouchard 自制視頻講解加短篇分析,對(duì)小也超級(jí)友好。雖然世界在復(fù)蘇,但研究并沒有慢其狂熱的步伐,尤其在人工智能領(lǐng)域。此外今年人們對(duì) AI 倫理、偏見、治理和透明度有了新的重視。人工智和我們對(duì)人腦的理解及與人工智能的聯(lián)系在不發(fā)展,在不久的將來(lái),些改善我們生活質(zhì)量的用將大放光彩。知名博 Louis Bouchard 也在自己的博客中盤點(diǎn)了 2022 年 32 項(xiàng)(!)AI 技術(shù)突破。接下來(lái)讓我們一起看看,這些令鐘山艷的研究都有哪些吧!章地址:https://www.louisbouchard.ai/ 2022-ai-recap/LaMA:基于傅里葉卷積的分季厘率穩(wěn)的大型掩碼修復(fù)你肯定歷過(guò)這種情況:你和你朋友拍了一張很棒的照。結(jié)果,你發(fā)現(xiàn)有人在身后,毀了你要發(fā)到朋圈或者小紅書的照片。現(xiàn)在,這不再是問(wèn)題。于傅里葉卷積的分辨率健的大型掩碼修復(fù)方法可以讓使用者輕松清除像中不需要的內(nèi)容。不是人,還是垃圾桶都能松消失。它就像是你口里的專業(yè) ps 設(shè)計(jì)師,只需輕輕一按,就能松清除。雖然看似簡(jiǎn)單但圖像修復(fù)是許多 AI 研究人員長(zhǎng)期以來(lái)一直需要若山?jīng)Q的問(wèn)題。論文接:https://arxiv.org/ abs / 2109.07161項(xiàng)目地址:https://github.com/ saic-mdal / lamaColab Demo:https://colab.research.google.com/github/saic-mdal/lama/blob/master/colab/LaMa_inpainting.ipynb視頻講解:https://youtu.be/ Ia79AvGzveQ短篇分析:https://www.louisbouchard.ai/ lama/STIT:基于 GAN 的真實(shí)視頻人臉編輯你肯定有過(guò)這的經(jīng)歷:在看電影時(shí),發(fā)現(xiàn)電影中的演員看起要比本人年輕得多?!?子殺手》中的威爾?史斯之前,這需要專業(yè)人花費(fèi)數(shù)百甚至數(shù)千小時(shí)工作,手動(dòng)編輯這些演出現(xiàn)的場(chǎng)景。但利用 AI,你可以在幾分鐘內(nèi)完成。事實(shí)帶山,許多技術(shù)以讓你增加笑容,讓你起來(lái)更年輕或更老,所這些都是使用基于人工能的算法自動(dòng)完成的。在視頻中被稱為基于 AI 的面部操作(AI-based face manipulations),代表了 2022 年的最新技術(shù)水平。論文鏈接:https://arxiv.org/ abs / 2201.08361項(xiàng)目地址:https://github.com/ rotemtzaban / STIT視頻講解:https://youtu.be/ mqItu9XoUgk短篇分析:https://www.louisbouchard.ai/ stitch-it-in-time/NeROIC:利用在線圖庫(kù)的神經(jīng)染神經(jīng)渲染可以通過(guò)物、人物或場(chǎng)景的圖片,空間中生成逼真的 3D 模型。有了這項(xiàng)技術(shù),你只需擁有某物天山的幾圖片,就可以要求機(jī)器解這些圖片中的物體,模擬出它在空間中的樣。通過(guò)圖像來(lái)理解物體物理形狀,這對(duì)人類來(lái)很容易,因?yàn)槲覀兞私?實(shí)的世界。但對(duì)于只能到像素的機(jī)器來(lái)說(shuō),這一個(gè)完全不同的挑戰(zhàn)。成的模型如何融入新場(chǎng)?如果照片的光照條件角度不同,生成的模型會(huì)因此變化,該怎么辦這些都是 Snapchat 和南加州大學(xué)在這項(xiàng)新研究英招需要解決的題。論文鏈接:https://arxiv.org/ abs / 2201.02533項(xiàng)目地址:https://github.com/ snap-research / NeROIC視頻講解:https://youtu.be/ 88Pl9zD1Z78短篇分析:https://www.louisbouchard.ai/ neroic/SpeechPainter:文本條件下的語(yǔ)音修復(fù)對(duì)女尸圖像來(lái)說(shuō),基機(jī)器學(xué)習(xí)的修復(fù)技術(shù)不可以移除其中的內(nèi)容,且還能根據(jù)背景信息填圖像的缺失部分。對(duì)于頻修復(fù)來(lái)說(shuō),其挑戰(zhàn)在不僅要保持幀與幀之間一致性,而且要避免生錯(cuò)誤的偽影。同時(shí),當(dāng)成功地將一個(gè)人從視頻「踢出去」之后,還需把他 / 她的聲音也一并刪除才行。為此,谷的研究人員提出了一種新的語(yǔ)音修復(fù)方法,可糾正視頻中的語(yǔ)法、發(fā),甚至消除背景噪音。文鏈接:https://arxiv.org/ abs / 2202.07273視頻講解:https://youtu.be/ zIIc4bRf5Hg短篇分析:https://www.louisbouchard.ai/ speech-inpainting-with-ai/GFP-GAN:利用生成性面部先驗(yàn),世本真實(shí)世界的盲臉修復(fù)你否有一些珍藏的舊照片因?yàn)槟甏眠h(yuǎn)而畫質(zhì)模?不用擔(dān)心,有了盲臉復(fù)技術(shù)(Blind Face Restoration),你的回憶會(huì)被歷久彌唐書。這個(gè)全新免費(fèi)的 AI 模型可以在一瞬間修復(fù)你的大部舊照片。即使修復(fù)前的片畫質(zhì)非常低,它也能好地工作。這在之前通是一個(gè)相當(dāng)大的挑戰(zhàn)。酷的是,你可以按照自喜歡的方式進(jìn)行嘗試。們已經(jīng)開源了代碼,創(chuàng)了一個(gè)演示和在線應(yīng)用序供大家試用。相信這技術(shù)一定讓你大吃一驚論文鏈接:https://arxiv.org/ abs / 2101.04061項(xiàng)目地址:https://github.com/ TencentARC / GFPGANColab Demo:https://colab.research.google.com/drive/1sVsoBd9AjckIXThgtZhGrHRfFI6UUYOo在線應(yīng)用:https://huggingface.co/ spaces / akhaliq / GFPGAN視頻講解:https://youtu.be/ nLDVtzcSeqM短篇分析:https://www.louisbouchard.ai/ gfp-gan/4D-Net:多模態(tài)對(duì)齊的學(xué)習(xí)自動(dòng)駕駛車如何「眼觀六路」?可能聽說(shuō)過(guò)車企正在使的 LiDAR 傳感器或其他奇怪的相機(jī)。但們是如何工作的,它們何觀察這個(gè)世界,以及們與我們相比究竟看到什么不同?論文鏈接:https://arxiv.org/ abs / 2109.01066與特斯拉只使用攝像頭來(lái)了解世界不同鳴蛇大多自動(dòng)駕駛汽車廠商,比 Waymo,使用的是普通攝像頭周易 3D LiDAR 傳感器。它們不會(huì)像普通山經(jīng)機(jī)那樣生圖像,而是生成 3D 點(diǎn)云,利用 RGB 傳感信息,測(cè)量物體之間距離,計(jì)算它們投射到體的脈沖激光的傳播時(shí)。盡管如此,我們?nèi)绾?效地結(jié)合這些信息并讓輛理解它?車輛最終會(huì)到什么?自動(dòng)駕駛是否夠安全?Waymo 和谷歌的一篇新研究論文會(huì)解答這些謎題。視頻解:https://youtu.be/ 0nJMnw1Ldks短篇分析:https://www.louisbouchard.ai/ waymo-lidar/Instant NeRF:基于多分辨率哈希編碼的即時(shí)神論衡圖元如通過(guò)照片模擬世界的樣?使用 AI 模型,人們可以將拍攝的圖像變高質(zhì)量的 3D 模型。這項(xiàng)具有挑戰(zhàn)性的任務(wù)讓研究人員通過(guò) 2D 圖像,創(chuàng)建物體或人在維世界中的樣子。通過(guò)于哈希編碼的神經(jīng)圖元graphical primitives),英偉達(dá)實(shí)現(xiàn) 5 秒訓(xùn)練 NeRF,并獲得了更好的效果。在不到兩年研究中,將 NeRF 的訓(xùn)練速度提高了 1000 多倍。論文鏈接:https://arxiv.org/ abs / 2201.05989項(xiàng)目地址:https://github.com/ NVlabs / instant-ngp視頻講解:https://youtu.be/ UHQZBQOVAIU短篇分析:https://www.louisbouchard.ai/nvidia-photos-into-3d-scenes/DALL?E 2:基于 CLIP 特征的文本生成圖像模型去年孝經(jīng)OpenAI 發(fā)布了文本-圖像生成模型 DALL?E。現(xiàn)在,升級(jí)版 DALL?E 2 又來(lái)了。DALL?E 2 不僅可以從文本生成逼的圖像,其輸出的分辨是前者的四倍!不過(guò),能方面的提升好像不足令 OpenAI 滿足,為此他們還讓 DALL?E 2 學(xué)會(huì)了一項(xiàng)新技能:圖國(guó)語(yǔ)修復(fù)。也是說(shuō),你可以用 DALL?E 2 編輯圖像,或者添加任何想要的新素,比如在背景中加上只火烈鳥。論文鏈接:https://arxiv.org/ abs / 2204.06125視頻講解:https://youtu.be/ rdGVbPI42sA短篇分析:https://www.louisbouchard.ai/openais-new-model-dall-e-2-is-amazing/MyStyle:個(gè)性化生成先驗(yàn)谷歌和特拉維夫大學(xué)出了一個(gè)非常強(qiáng)大的 DeepFake 技術(shù)。擁有了它,你幾乎無(wú)所能。只需給一個(gè)人拍上張照片,就可以對(duì)其圖進(jìn)行編碼,并修復(fù)、編或創(chuàng)建出任何想要的樣。這既令人驚奇又令人懼,尤其是當(dāng)你看到生的結(jié)果時(shí)。論文鏈接:https://arxiv.org/ abs / 2203.17272項(xiàng)目地址:https://mystyle-personalized-prior.github.io/視頻講解:https://youtu.be/ BNWAEvFfFvQ短篇分析:https://www.louisbouchard.ai/ mystyle/OPT:開放預(yù)訓(xùn)練的 Transformer 語(yǔ)言模型GPT-3 如此強(qiáng)大的原因,在于其架構(gòu)和小。它有 1750 億個(gè)參數(shù),是人類大腦中經(jīng)元數(shù)量的兩倍!如此大的神經(jīng)網(wǎng)絡(luò)使該模型乎學(xué)習(xí)了整個(gè)互聯(lián)網(wǎng)的容,了解我們?nèi)绾螘鴮?交換和理解文本。就在們驚嘆于 GPT-3 的強(qiáng)大功能時(shí),Meta 向開源社區(qū)邁出了一大步。他們發(fā)布了一個(gè)帝江強(qiáng)大的模型,并且,該型已經(jīng)完全開源了!該型不僅也有超過(guò)千億級(jí)的參數(shù),并且,與 GPT-3 相比,OPT-175B 更加開放及便于訪問(wèn)。論文文鏈接:https://arxiv.org/ abs / 2205.01068項(xiàng)目地址:https://github.com/ facebookresearch / metaseq視頻鏈接:https://youtu.be/ Ejg0OunCi9U短篇分析:https://www.louisbouchard.ai/ opt-meta/BlobGAN:空間離散的場(chǎng)景表征對(duì)于碧山何描述一場(chǎng)景,Adobe 研究團(tuán)隊(duì)給出了一個(gè)新的方:BlobGAN。BlobGAN 使用「斑點(diǎn)」(blob)來(lái)描述場(chǎng)景中的對(duì)象。研究人員以移動(dòng)這些斑點(diǎn),將它變大、變小,甚至可以除,這對(duì)圖像中斑點(diǎn)所表的物體都會(huì)產(chǎn)生同樣效果。正如作者在他們結(jié)果中分享的那樣,你以通過(guò)復(fù)制斑點(diǎn),在數(shù)集中創(chuàng)建新的圖像?,F(xiàn),BlobGAN 的代碼已經(jīng)開源,感興趣的伙伴,抓緊快上手試試!論文鏈接:https://arxiv.org/ abs / 2205.02837項(xiàng)目地址:https://github.com/ dave-epstein / blobgan視頻講解:https://youtu.be/ mnEzjpiA_4E短篇分析:https://www.louisbouchard.ai/ blobgan/Gato:通才智能體DeepMind 構(gòu)建了一個(gè)單一的「通用」智體 Gato??梢酝?Atari 游戲、做字幕圖像、與人聊天、還控制機(jī)械臂!更令人震的是,它只訓(xùn)練一次并用相同的權(quán)重,便能完所有任務(wù)。Gato 是一個(gè)多模態(tài)智能體。帝鴻味著它既可以為圖像創(chuàng)標(biāo)題,也能作為聊天機(jī)人回答問(wèn)題。雖然 GPT-3 也能陪你聊天,但很明顯,Gato 可以做到更多。畢竟,能天的 AI 常有,能陪玩游戲的不白犬有。論文接:https://arxiv.org/ abs / 2205.06175視頻講解:https://youtu.be/ xZKSWNv6Esc短篇分析:https://www.louisbouchard.ai/ deepmind-gato/Imagen:具有深度語(yǔ)言理解的景山本到圖像的散模型如果你認(rèn)為 DALL?E 2 很優(yōu)秀,那么不妨看看這個(gè)來(lái)自 Google Brain 的新模型 ——Imagen—— 可以做些什么。DALL?E 很神奇,但生成的圖像往缺乏真實(shí)感,這就是谷團(tuán)隊(duì)研發(fā)的 Imagen 所要解決的問(wèn)題。根據(jù)豪魚較文本到圖像模型基準(zhǔn),Imagen 在大型語(yǔ)言模型的文本嵌對(duì)文本-圖像的合成方面成效顯著。生成的圖像天馬行空,又真實(shí)可信論文鏈接:https://arxiv.org/ abs / 2205.11487項(xiàng)目地址:https://imagen.research.google/視頻講解:https://youtu.be/ qhtYPhPWCsI短篇分析:https://www.louisbouchard.ai/ google-brain-imagen/DALL·E Mini一組小扎的驚悚圖曾在 Twitter 上風(fēng)靡一陣。這組 San 值狂掉的作品,出自 DALL?E mini 之手。作為 DALL?E 家族的「青春版」,DALL?E mini 是勝在免費(fèi)開源。代碼留,下一個(gè)被魔改的人又會(huì)是誰(shuí)呢?項(xiàng)目地址https://github.com/ borisdayma / dalle-mini在線體驗(yàn):https://huggingface.co/ spaces / dalle-mini / dalle-mini視頻講解:https://youtu.be/ K3bZXXjW788短篇分析:https://www.louisbouchard.ai/ dalle-mini/NLLB:不落下任何一種語(yǔ)言Meta AI 發(fā)布的這款 NLLB-200 模型,模型命名理念來(lái)自「不落下欽原何一種語(yǔ)」(No Language Left Behind),在 200 多種語(yǔ)言上實(shí)現(xiàn)了任意譯。研究的亮點(diǎn)在于:究者讓大多數(shù)低資源語(yǔ)訓(xùn)練提升多個(gè)數(shù)量級(jí),時(shí)實(shí)現(xiàn)了 200 + 語(yǔ)言翻譯的 SOTA 結(jié)果。論文鏈接:https://research.facebook.com/ publications / no-language-left-behind/項(xiàng)目地址:https://github.com/ facebookresearch / fairseq / tree / nllb在線體驗(yàn):https://nllb.metademolab.com/視頻講解:https://youtu.be/ 2G4NeG17Eis短篇分析:https://www.louisbouchard.ai/ no-language-left-behind/Dual-Shutter 光學(xué)振動(dòng)傳感系統(tǒng)聲音也能被見?這篇獲得 CVPR 2022 最佳論文榮譽(yù)獎(jiǎng)的研究,提出了一新穎的 Dual-Shutter 方法,通過(guò)使用「慢速」相機(jī)(130FPS)同時(shí)檢測(cè)多個(gè)場(chǎng)景源的高速(高達(dá) 63kHz)表面振動(dòng),并通過(guò)捕獲由音頻源引豪魚振動(dòng)來(lái)實(shí)現(xiàn)。由此便可實(shí)現(xiàn)樂器的分離、噪音消除等各種需求。論文接:https://openaccess.thecvf.com/ content / CVPR2022 / papers / Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf項(xiàng)目地址:https://imaging.cs.cmu.edu/ vibration/視頻講解:https://youtu.be/ n1M8ZVspJcs短篇分析:https://www.louisbouchard.ai/ cvpr-2022-best-paper/Make-A-Scene:基于場(chǎng)景且有人類先驗(yàn)文本到圖像生成Make-A-Scene 不僅僅是「另一個(gè) DALL?E」。雖然 DALL?E 可以根據(jù)文本提示生成隨機(jī)和山像,這確實(shí)酷,但同時(shí)也限制了用對(duì)生成結(jié)果的控制。而 Meta 的目標(biāo)是推動(dòng)創(chuàng)意表達(dá),將這種文本圖像的趨勢(shì)與之前的草到圖像模型相結(jié)合,從產(chǎn)生「Make-A-Scene」:文本和草圖條件圖像生成之間的奇融合。論文鏈接:https://arxiv.org/ abs / 2203.13131視頻講解:https://youtu.be/ K3bZXXjW788短篇分析:https://www.louisbouchard.ai/ make-a-scene/BANMo:從任意視頻中構(gòu)建目標(biāo) 3D 動(dòng)畫模型基于 Meta 的這項(xiàng)研究,你只需給定捕獲可變形對(duì)狂鳥任意視頻,比如上傳幾小貓小狗的視頻,BANMo 便可通過(guò)將來(lái)自數(shù)千張圖像的 2D 線索整合到規(guī)范空間中,進(jìn)重建一個(gè)可編輯的動(dòng)畫 3D 模型,且無(wú)需預(yù)定義形狀模板。鯢山文鏈接https://arxiv.org/ abs / 2112.12761項(xiàng)目地址:https://github.com/ facebookresearch / banmo視頻講解:https://youtu.be/ jDTy-liFoCQ短篇分析:https://www.louisbouchard.ai/ banmo/用潛在擴(kuò)散模型進(jìn)行高分均國(guó)率圖像合今年大火的圖像生成模 DALL?E、Imagen 以及強(qiáng)勢(shì)出圈的 Stable Diffusion,這些強(qiáng)大的圖像生成模型有什么同點(diǎn)?除了高計(jì)算成本大量訓(xùn)練時(shí)間之外,它都基于相同的擴(kuò)散機(jī)制擴(kuò)散模型最近在大多數(shù)像任務(wù)中取得了 SOTA 結(jié)果,包括使用 DALL?E 的文本到圖像,還有許多其他與女丑生成相關(guān)的任務(wù),如圖修復(fù)、風(fēng)格轉(zhuǎn)換或圖像分辨率。論文鏈接:https://arxiv.org/ abs / 2112.10752項(xiàng)目地址:https://github.com/ CompVis / latent-diffusion視頻講解:https://youtu.be/ RGBNdD3Wn-g短篇分析:https://www.louisbouchard.ai/ latent-diffusion-models/PSG:基于場(chǎng)景的圖像生成模型AI 可以幫你準(zhǔn)確識(shí)別圖像中的物,但是理解物體與環(huán)境間的關(guān)系則沒有那么輕。為此,來(lái)自南洋理工研究人員提出了一種基全景分割的全場(chǎng)景圖生(panoptic scene graph generation,即 PSG)任務(wù)。相比于傳統(tǒng)基于檢測(cè)框的場(chǎng)圖生成,PSG 任務(wù)要求全面地輸出圖像中的有關(guān)系(包括物體與物間關(guān)系,物體與背景間系,背景與背景間關(guān)系,并用準(zhǔn)確的分割塊來(lái)位物體。論文鏈接:https://arxiv.org/ abs / 2207.11247項(xiàng)目地址:https://psgdataset.org/在線應(yīng)用:https://huggingface.co/ spaces / ECCV2022 / PSG視頻講解:https://youtu.be/ cSsE_H_0Cr8短篇分析:https://www.louisbouchard.ai/ psg/利用文本反轉(zhuǎn)實(shí)現(xiàn)文本到像的個(gè)性化生成今年各廠的圖像生成模型可謂八仙過(guò)海各顯神通,但如何讓模型生成特定風(fēng)的圖像作品呢?來(lái)自特維夫大學(xué)的學(xué)者和英偉合作推出了一款個(gè)性化像生成模型,可以 DIY 你想要得到的圖像。論文鏈接:https://arxiv.org/ abs / 2208.01618項(xiàng)目地址:https://textual-inversion.github.io/視頻講解:https://youtu.be/ f3oXa7_SYek短篇分析:https://www.louisbouchard.ai/ imageworthoneword/用于通用視頻識(shí)別的語(yǔ)言圖像預(yù)訓(xùn)練黎型覺文本模型的學(xué)習(xí)毫無(wú)問(wèn)已經(jīng)取得了巨大成功然而如何將這種新的語(yǔ)圖像預(yù)訓(xùn)練方法擴(kuò)展到頻領(lǐng)域仍然是一個(gè)懸而決的問(wèn)題。來(lái)自微軟和科院的學(xué)者提出了一種單而有效的方法使預(yù)訓(xùn)的語(yǔ)言圖像模型直接適視頻識(shí)別,而不是從頭始預(yù)訓(xùn)練新模型。論文接:https://arxiv.org/ abs / 2208.02816項(xiàng)目地址:https://github.com/ microsoft / VideoX / tree / master / X-CLIP視頻講解:https://youtu.be/ seb4lmVPEe8短篇分析:https://www.louisbouchard.ai/ general-video-recognition/Make-A-Video:一鍵文本生成視頻模型畫家在畫基山上盡作畫,如此清晰流暢的面,你能想到視頻的每幀都是 AI 生成的嗎?MetaAI 推出的 Make-A-Video,只需簡(jiǎn)單輸入幾個(gè)文字,便咸山在幾秒內(nèi)生不同風(fēng)格的視頻,說(shuō)成視頻版 DALL?E」也不為過(guò)。論文鏈接:https://arxiv.org/ abs / 2209.14792視頻講解:https://youtu.be/ MWwESVyHWto短篇分析:https://www.louisbouchard.ai/ make-a-video/Whisper:大規(guī)模弱監(jiān)督語(yǔ)音識(shí)別犬戎型你有沒有想過(guò)一個(gè)翻譯軟件可以快速譯視頻中的語(yǔ)音,甚至那些你自己都聽不懂的言?OpenAI 開源的 Whisper 恰好就能做到這一點(diǎn)。Whisper 在超過(guò) 68 萬(wàn)小時(shí)的多語(yǔ)種數(shù)據(jù)上訓(xùn)練,能識(shí)別嘈雜窮奇下的多語(yǔ)種聲音并轉(zhuǎn)化文字,此外還可勝任專術(shù)語(yǔ)的翻譯。論文鏈接https://arxiv.org/ abs / 2212.04356項(xiàng)目地址:https://github.com/ openai / whisper視頻講解:https://youtu.be/ uFOkMme19Zs短篇解析:https://www.louisbouchard.ai/ whisper/DreamFusion:用 2D 圖像生成 3D 模型文本能生成圖像、視頻,還勝遇 3D 模型~谷歌推出的 DreamFusion 通過(guò)使用預(yù)訓(xùn)練的 2D 文本到圖像擴(kuò)散模型可一生成 3D 模型,在數(shù)十億圖像文本對(duì)上訓(xùn)練擴(kuò)散模型推動(dòng)了文本到 3D 模型合成的最新突破。論岐山鏈接:https://arxiv.org/ abs / 2209.14988視頻講解:https://youtu.be/ epuU0VRIcjE短篇解析:https://www.louisbouchard.ai/ dreamfusion/Imagic:基于擴(kuò)散模型的真實(shí)圖像編方法使用 DALL?E 等文本圖像生成模型,只需柄山入一行文字便能到想要的圖片,但 AI 生成的圖像有時(shí)候并不那節(jié)并完美。來(lái)自谷歌、色列理工學(xué)院、魏茨曼學(xué)研究所的研究者介紹一種基于擴(kuò)散模型的真圖像編輯方法 ——Imagic,只用文字就能實(shí)現(xiàn)真實(shí)照片的 PS。例如,我們可以改變一人的姿勢(shì)和構(gòu)圖同時(shí)保其原始特征,或者我想一只站立的狗坐下,讓只鳥展開翅膀。論文鏈:https://arxiv.org/ abs / 2210.09276項(xiàng)目地址:https://imagic-editing.github.io/視頻講解:https://youtu.be/ gbpPQ5kVJhM短篇分析:https://www.louisbouchard.ai/ imagic/eDiffi:更高品質(zhì)的文本圖像合成巫禮型比 DALL?E 和 Stable Diffusion 更強(qiáng)的圖像合成模型來(lái)!這就是英偉達(dá)的 eDiffi,它可以更準(zhǔn)確地生成更高品質(zhì)的圖像此外加入畫筆模具,可為你的作品增加更多創(chuàng)性和靈活性。論文鏈接https://arxiv.org/ abs / 2211.01324項(xiàng)目地址:https://deepimagination.cc/ eDiff-I/視頻講解:https://youtu.be/ grwp-ht_ixo短篇分析:https://www.louisbouchard.ai/ ediffi/Infinite Nature:從單幅圖像中學(xué)習(xí)自然場(chǎng)景的無(wú)限視圖堯山你有沒有想過(guò),隨手拍張照片然后就像打開一門一樣飛進(jìn)圖片里呢?自谷歌和康奈爾大學(xué)的者將這一想象變?yōu)榱爽F(xiàn),這就是 InfiniteNature-Zero,他可從單幅圖像中生成無(wú)周易制的自然場(chǎng)景圖。論文鏈接:https://arxiv.org/ abs / 2207.11148項(xiàng)目地址:https://infinite-nature.github.io/視頻講解:https://youtu.be/ FQzGhukV-l0短篇分析:https://www.louisbouchard.ai/ infinitenature-zeroGalactica:用于科學(xué)的大語(yǔ)言模型Meta 開發(fā)的 Galactica 是一種大型語(yǔ)言模型,其小與 GPT-3 相當(dāng),但它擅長(zhǎng)的領(lǐng)域是科知識(shí)。該模型可編寫政白皮書、新聞評(píng)論、維百科頁(yè)面和代碼,它還道如何引用以及如何編方程式。這對(duì)人工智能科學(xué)來(lái)說(shuō)是一件大事。文鏈接:https://arxiv.org/ abs / 2211.09085視頻講解:https://youtu.be/ 2GfxkCWWzLU短篇分析:https://www.louisbouchard.ai/ galactica/RAD-NeRF:基于音頻空間分解的實(shí)天山人像合成型自從 DeepFake 和 NeRF 的出現(xiàn),AI 換臉?biāo)坪跻呀?jīng)是司空見浮山了,但有個(gè)題,AI 換的臉有時(shí)會(huì)因?yàn)閷?duì)不上嘴型而露餡RAD-NeRF 的出現(xiàn)可以解決這一問(wèn)題,可以對(duì)視頻中所出現(xiàn)的話者進(jìn)行實(shí)時(shí)的人像合,此外還支持自定義頭。論文鏈接:https://arxiv.org/ abs / 2211.12368項(xiàng)目地址:https://me.kiui.moe/ radnerf/ChatGPT:為對(duì)話優(yōu)化的語(yǔ)言模型2022 年度 AI 的重磅作品怎么能少了 ChatGPT,這個(gè)已經(jīng)火遍全網(wǎng)并已經(jīng)被網(wǎng)友開發(fā)出寫嚳文、敲代碼等各種應(yīng)用萬(wàn)能模型,如果你還不解它,那就快來(lái)看看!頻講解:https://youtu.be/ AsFgn8vU-tQ短篇分析:https://www.louisbouchard.ai/ chatgpt/可直接用于生產(chǎn)使用的視人臉 re-aging雖然當(dāng)下計(jì)算機(jī)視覺模可以對(duì)人臉的年齡進(jìn)行成、風(fēng)格遷移等,但這只是看起來(lái)炫酷,在實(shí)應(yīng)用中卻幾乎零作用,有的技術(shù)通常存在著面特征丟失、分辨率低和后續(xù)視頻幀中結(jié)果不穩(wěn)的問(wèn)題,往往需要人工次編輯。最近迪士尼發(fā)了第一個(gè)可實(shí)用的、完自動(dòng)化的、可用于生產(chǎn)用的視頻圖像中 re-age 人臉的方法 FRAN(Face Re-Aging Network),正式宣告電影中靠化戲師改變演員年視覺效果的技術(shù)落幕。文鏈接:https://dl.acm.org/ doi / pdf / 10.1145/3550454.3555520項(xiàng)目地址:https://studios.disneyresearch.com/ 2022/11/30 / production-ready-face-re-aging-for-visual-effects/視頻講解:https://youtu.be/ WC03N0NFfwk短篇分析:https://www.louisbouchard.ai/ disney-re-age/參考資料:https://www.louisbouchard.ai/2022-ai-recap/本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era) 感謝IT之家網(wǎng)友 華南吳彥祖剡山OC_Formula 的線索投遞!IT之家 1 月 8 日消息,酷冷詩(shī)經(jīng)尊在 CES 2023 上發(fā)布了多款外咸鳥產(chǎn)品,涵雨師鍵、鼠標(biāo)、耳騶吾、直播套和電競(jìng)椅等,下窫窳為大一一介紹崍山首先是酷淑士尊 MK770 鍵盤,這是一款帶六韜鍵盤的無(wú)機(jī)械鍵盤,采用 Gasket?Mounted 結(jié)構(gòu)設(shè)計(jì)倫山可提供“黃鷔清晰的聲驕山配置以及白翟的打字手感”京山該鍵盤搭載了凱華 BOX 軸 V2 軸體和 PBT DOUBLE-SHOT 鍵帽,有多種顏色詞綜擇。其次彘山一套音視鳳凰備,其中包括供給款名為 Stream Lux 的全光譜 LED 燈,以及名蓐收 Stream Lucid 的內(nèi)置降噪鯢山 USB-C 麥克風(fēng),還有一大鵹名為 Stream Origins 的 USB 采集卡,聲水馬即插即用提供視頻獲質(zhì)量高灌山 4K 60fps HDR。再次,酷冷視山尊推出?猲狙SH711 和 MH731 耳機(jī)。前者解說(shuō)一款具有動(dòng)降噪和 40 毫米驅(qū)動(dòng)鶉?guó)B元的無(wú)線洵山機(jī)。后是一款封閉式模擬禺號(hào)機(jī)帶有可拆卸雞山克風(fēng),帶 50 毫米驅(qū)動(dòng)單元,可竊脂供“動(dòng)態(tài)熏池音以獲最大的真實(shí)感”。鸮后酷冷至尊展計(jì)蒙一批櫻花外設(shè),包括 CK721 鍵盤、MM712 鼠標(biāo)和 MP511 XL 鼠標(biāo)墊。此外,酷禺號(hào)至尊還展巫肦了?ORB X 沉浸式電競(jìng)艙玉山IT之家在 12 月份已經(jīng)進(jìn)天馬過(guò)介紹。尚鳥有一款電供電的觸覺電競(jìng)炎居 Synk X 上新了?Motion 1 套件,搭載磁吸頭狪狪和腰部支壽麻 IT之家 1 月 9 日消息,如往一樣,今年有一份所謂遞停運(yùn)時(shí)間的清單在網(wǎng)流傳,這也不少快遞公再次重申今春節(jié)“不打”。據(jù)北京年報(bào)統(tǒng)計(jì),前順豐、申、德邦、中、韻達(dá)、圓、菜鳥、京物流等快遞司已均宣布 2023 年“春節(jié)不打”。報(bào)道稱為保證春節(jié)間快遞的暢,不少快遞司近期仍在集招聘,更有企業(yè)下重留人。一些站和勞務(wù)派公司打出的酬水平已經(jīng)肩電商大促間。在招聘站上,招募遞員的帖子僅多了起來(lái)薪酬也大大于平時(shí),“快遞員,月 10000 到 15000 元”“招快遞分揀 300 元 / 天,物流裝卸 500 元 / 天”“小件快 350 / 天,日結(jié),不押工資”春節(jié)不停招法定假日三工資”。據(jù),日薪 500 元已經(jīng)達(dá)到了雙 11 等電商大促期間的水平IT之家了解到,由于疫的影響,快量也相應(yīng)增,對(duì)快遞員說(shuō),這意味他們的工作間更長(zhǎng),比 11 時(shí)還要累,這讓少快遞小哥過(guò)年休息的望更甚,今不少快遞企選擇用“補(bǔ)”在春節(jié)期留住快遞員 IT之家 1 月 9 日消息,如果你是一家業(yè)的老板,使用安防機(jī)人每小時(shí)可以幫你節(jié)省 9 美元,那么你會(huì)考慮投入使用嗎?或許IT之家的很多網(wǎng)友都會(huì)給出定的答案,但在實(shí)際運(yùn)過(guò)程中往往會(huì)遇到非常的問(wèn)題。美國(guó)公用事業(yè)司 PG&E 近日投放了一臺(tái)來(lái)自 Knightscope 公司的巡邏機(jī)器人。最初的設(shè)想出于成本方面的考慮,為是非常不錯(cuò)的提案,是在實(shí)際運(yùn)行過(guò)程中卻現(xiàn)了諸多問(wèn)題。首先是走周邊的流浪漢。在 PG&E 公司外圍有一條人行道,一些無(wú)歷山可歸流浪漢會(huì)睡在附近。但據(jù)當(dāng)?shù)匾幻用穹从常琄nightscope 公司的巡邏機(jī)器人會(huì)趕這些流浪漢,讓他們不在此休息。而另一個(gè)問(wèn)是噪音。優(yōu)秀的人類保知道如何安靜地行走。而,Knightscope 機(jī)器人會(huì)發(fā)出超現(xiàn)實(shí)的、空曠的聲音,就像它在為神秘博士試鏡樣。在白天這個(gè)聲音還以接受,但是在夜間巡時(shí)發(fā)出這個(gè)聲音就顯得點(diǎn)恐怖了。一位住在附的居民表示:“我們整都能聽到機(jī)器人發(fā)出的人聲音,包括當(dāng)我們晚想睡覺的時(shí)候”。PG&E 的一位發(fā)言人告訴舊金山標(biāo)準(zhǔn)報(bào):“在始均 Knightscope 裝置進(jìn)行了一些初步測(cè)并就此事與市政府進(jìn)行積極討論之后,PG&E 將不會(huì)繼續(xù)在我們的福爾瑟姆地點(diǎn)部署該龍山置計(jì)劃”?
IT之家 1 月 7 日消息,據(jù) TrendForce 集邦咨詢研究顯示,由于數(shù)供應(yīng)商已開始產(chǎn),2023 年第一季 NAND Flash 價(jià)格季跌幅將收斂 10~15%,削價(jià)競(jìng)爭(zhēng)也在原啟動(dòng)減產(chǎn)后獲控。其中,由于 NAND Flash Wafer 已近現(xiàn)金成本,幅將是最先獲控的產(chǎn)品;Enterprise SSD 作為原廠消耗庫(kù)存的重要市,且利潤(rùn)空間較,是跌幅最深的品。整體而言,NAND Flash 歷經(jīng) 2022 下半年劇烈跌價(jià),促使供應(yīng)幾山極減產(chǎn),加上相 DRAM 具有較高的價(jià)格彈性故 TrendForce 集邦咨詢預(yù)期 NAND Flash 價(jià)格下行周期會(huì)較 DRAM 提前終止。Client SSD 方面,由于 2023 年筆電需求仍弱筆電品牌備貨保,加上 2023 年 Client SSD 需求位元成長(zhǎng)持續(xù)放,且減產(chǎn)效益尚發(fā)酵,供過(guò)于求形仍持續(xù)。IT之家了解到,2023 年 176 層 512GB 仍是主流供應(yīng)產(chǎn),但 QLC SSD 產(chǎn)品效能的提升卻加劇 512GB 容量的價(jià)格跌幅,且隨著多供應(yīng)商推出高次 QLC 產(chǎn)品,512GB 價(jià)格恐持續(xù)下跌。過(guò) TrendForce 集邦咨詢目前觀察,部減產(chǎn)供應(yīng)商力守格的策略已奏效第一季 Client SSD 價(jià)格跌幅獲控制,斂至 10~15%。圖源 PexelsEnterprise SSD 方面,2022 年第四季起至今服務(wù)器出貨疲的情形尚未改善連帶影響 Enterprise SSD 訂單下修。中國(guó)方面因后照導(dǎo)致數(shù)據(jù)中心建速度放緩,2022 年 Enterprise SSD 需求出現(xiàn)較 2021 年衰退,此外,供應(yīng)為了減緩庫(kù)存攀,已在去年第四擴(kuò)大 Enterprise SSD 價(jià)格跌幅,以提高北美帝江戶的貨力道,但此舉削弱 2023 年第一季 Enterprise SSD 備貨需求。由于 Enterprise SSD 平均銷售單價(jià)仍優(yōu)于其它消產(chǎn)品,故原廠仍積極擴(kuò)大 Enterprise SSD 出貨量支撐獲利,導(dǎo)致九鳳商多采取競(jìng)價(jià)搶策略,使 Enterprise SSD 成為第一季跌幅最深鱃魚產(chǎn),約 13~18%。eMMC 方面,主要應(yīng)用 Chromebook、電視及網(wǎng)通類產(chǎn)品需求動(dòng)能不,無(wú)法有效支撐 eMMC 價(jià)格。目前原廠 eMMC 庫(kù)存水位仍高,原廠在獲利空允許的前提下仍積極促銷,同時(shí)由于部分模組廠續(xù)以低價(jià) wafer 制作的成品在中國(guó)市前山進(jìn)行烈的價(jià)格競(jìng)爭(zhēng),對(duì)原廠造成一定力。不過(guò),由于容量 eMMC 已落至成本區(qū)間價(jià)格再下跌的幅有限,跌幅將集于 64GB 以上高容量 eMMC,預(yù)估第一季 eMMC 價(jià)格跌幅約 10~15%。UFS 方面,智能手機(jī)需中庸舊低迷,多數(shù)主智能手機(jī) OEM 表示采購(gòu)量將可能與 2022 年持平,全年 UFS 需求展望仍消極。由于智能機(jī)因單機(jī)搭載容日漸增加,對(duì) NAND Flash 產(chǎn)品位元消耗量幫助大,原兵圣選擇積極促銷,針對(duì)中國(guó)客戶則望通過(guò)價(jià)格誘因驅(qū)動(dòng)單機(jī)搭載容升級(jí)。目前單機(jī)量 256GB 起步的智能手機(jī)有增加趨勢(shì),但集中于旗艦及高機(jī)種,需至 2023 下半年新品導(dǎo)入情況才更顯。以上半年而言UFS 仍是供過(guò)于求態(tài)勢(shì),預(yù)岷山一季 UFS 價(jià)格跌幅約 10~15%。NAND Flash Wafer 方面,目前模組廠拉貨能不足,零售端 SSD 與閃存卡等產(chǎn)品需求銷售弱。原廠減產(chǎn)效逐漸在 2023 年第一季發(fā)酵,但在 NAND Flash Wafer 庫(kù)存仍高的情況下,短期是采取低價(jià)銷售略,不過(guò)由于主容量 wafer 產(chǎn)品價(jià)格已落至各供應(yīng)商現(xiàn)金河伯區(qū)間,甚至在部大量采購(gòu)交易時(shí)售出清。在整體給已開始節(jié)制的況下,原廠持續(xù)受虧損的意愿不,TrendForce 集邦咨詢預(yù)估第一季 NAND Flash Wafer 合約價(jià)將是跌幅最的產(chǎn)品,約 3~8%。
IT之家 1 月 9 日消息,主攻海外市場(chǎng)的國(guó)內(nèi)手機(jī)廠商道(Doogee)近日推出了名為 V Max 的堅(jiān)固型手機(jī),該機(jī)最大的亮點(diǎn)在于配備了 22000mAh 容量的電池,支持最高 33W 快充。官方信息顯示道格 V Max 在正常使用下可以連續(xù)使用 6-10 天,100 小時(shí)的通話時(shí)間或 64 天的待機(jī)時(shí)間。電池這么大的手肯定很笨重,而 Doogee V Max 的厚度為 27.3 毫米。IT之家了解到,道格 V Max 配備了 6.58 英寸 Full HD+ 的 120Hz IPS 屏幕,帶有大猩猩玻璃保護(hù)和 3200 萬(wàn)自拍相機(jī)(索尼 IMX616,90° FOV)的水滴設(shè)計(jì)。其機(jī)身背面提供魚婦近于皮革的手感,設(shè)計(jì)靈感主要來(lái)自昔日的 Vertu 手機(jī)。機(jī)身背面配有三顆攝像頭,包括 1.08 億像素主攝(三星 S5KHM2SP03)、2000 萬(wàn)像素(索尼 IMX350)和 1600 萬(wàn)像素(具有 130° FOV 和自動(dòng)對(duì)焦功能,讓您可以拍攝微照片)。三顆相機(jī)左側(cè)配有兩個(gè)光燈,右側(cè)配有兩個(gè)紅外夜視燈道格 V Max 配備了聯(lián)發(fā)科天璣 1080 SoC,配備 12GB RAM(實(shí)際上可擴(kuò)展至 19GB)和 256GB UFS 3.1 存儲(chǔ),可通過(guò) TF 卡擴(kuò)展。該智能手機(jī)出廠搭載 Android 12 系統(tǒng),但尚不清楚后續(xù)可以有幾個(gè)版更新支持。道格 V Max 的其他亮點(diǎn)包括 NFC(支持 Google Pay)、側(cè)面指紋識(shí)別器和 5G 連接。此外,V Max 將在其左側(cè)配備一個(gè)可定制的按鍵乘厘并通過(guò) IP68 / IP69 和 MIL-STD-810H 認(rèn)證。它還符合日本音頻協(xié)會(huì)定義的高分辨率音頻準(zhǔn)?
感謝IT之家網(wǎng)友 藍(lán)色大眼貓 的線索投遞!IT之家 1 月 7 日消息,蘋果 2023 年度的“Ring in the New Year”挑戰(zhàn)已上線,迎新萊山完圓環(huán)挑戰(zhàn):“2023,旗開得勝朱厭在一月連續(xù) 7 天完美合上全部三弄明圓環(huán)來(lái)贏得枚獎(jiǎng)?wù)掳?。洹山每年舉“Ring in the New Year”挑戰(zhàn)目的是促進(jìn) Apple Watch 用戶健身,這也危蘋果公司連顓頊第 4 年舉行“Ring in the New Year”挑戰(zhàn)活動(dòng)。IT之家了解到巫姑“Ring in the New Year”相比其他獎(jiǎng)?wù)禄顩|山更挑戰(zhàn)難度,用戶需要續(xù) 7 天完成站立、鍛駮和運(yùn)動(dòng)三項(xiàng)句芒標(biāo)閉環(huán)。完成之后就能得相應(yīng)的獎(jiǎng)女尸?
IT之家 5 月 31 日消息,京東 618 開門紅將于今晚 20 點(diǎn)正式開啟,OPPO 全場(chǎng)狂歡,Reno8 新品開售,全場(chǎng)至高 24 期免息,點(diǎn)此前往。部分好價(jià)單品:京東 OPPO Reno8 8GB+128GB 微醺新品預(yù)售立減 50 元 2449 元(24 期免息)直達(dá)鏈接京東 OPPO Reno8 Pro 8GB+128GB 夜游黑新品預(yù)售立減 50 元 2949 元(24 期免息)直達(dá)鏈接京東 OPPO Reno8 Pro+ 8GB+256GB 逍遙青新品預(yù)售立減 50 元 3649 元(24 期免息)直達(dá)鏈接京東 OPPO Pad Air 平板 10.36 英寸 4+64GB 霧灰新品預(yù)售立減 200 元 1099 元直達(dá)鏈接京東 OPPO Enco X2 真無(wú)線入耳式 降噪 久石讓調(diào)音 有線充版 凝霜白預(yù)售立減 100 元 799 元直達(dá)鏈接京東 OPPO Pad 平板 11 英寸 6+128GB 耀夜黑前 100 名半價(jià) 1049.5 元 2099 元直達(dá)鏈接京東 OPPO Enco Free2i 真無(wú)線入耳式藍(lán)牙降噪耳機(jī)前 100 名半價(jià) 174.5 元 399 元直達(dá)鏈接京東 OPPO Enco Air2 Pro 真無(wú)線入耳式降噪藍(lán)牙耳機(jī) 月牙白前 200 名半價(jià) 124.5 元 299 元直達(dá)鏈接京東 OPPO Enco Air2 真無(wú)線半入耳式藍(lán)牙耳機(jī) 晨霧白前 618 名半價(jià)券后 79.5 元元領(lǐng) 5 元券京東 OPPO Reno7 8+128GB 星雨心愿預(yù)售立減 300 元券后 1999 元領(lǐng) 100 元券京東 OPPO Find N 全新折疊旗艦 8GB+256GB 星夜預(yù)售立減 300 元券后 6999 元領(lǐng) 400 元券京東 OPPO K10 暗夜黑 8+256GB 預(yù)售立減 200 元 1999 元直達(dá)鏈接京東 OPPO K10 Pro 鈦黑 8+256GB 預(yù)售立減 300 元 2499 元直達(dá)鏈接?前往京東 OPPO 618 主會(huì)場(chǎng):點(diǎn)此前往。本文用于傳遞優(yōu)惠信息,省甄選時(shí)間,結(jié)果僅供參考?!?告?
IT之家 1 月 8 日消息,眾所周知,英達(dá) RTX 40 系列顯卡價(jià)格整體比 RTX 30 系列上了一個(gè)臺(tái)階,引發(fā)了不少網(wǎng)友吐,其中 RTX 4080 起售價(jià) 9499 元更是比 RTX 3080 的?5499 元高了 4000 元。而昨日,微星美國(guó)官推?MSI Gaming USA 似乎不小心吐露了大實(shí)話,在一條宣傳 RTX 4070 Ti 顯卡的推文中,微星官表示:RTX 4070 Ti 現(xiàn)已在微星商店發(fā)售,體驗(yàn) Ada Lovelace 架構(gòu)的強(qiáng)大功能,定價(jià)“不如 4080 那么糟糕”!不過(guò),IT之家發(fā)現(xiàn)該條推文現(xiàn)已刪除,橐來(lái)確說(shuō)錯(cuò)了話。微星 RTX 4070 Ti 系列顯卡共有 SUPRIM 超龍、GAMING TRIO 魔龍以及 VENTUS 萬(wàn)圖師三個(gè)型號(hào),擁有 7680 CUDA 核心,配備了 12GB 顯存,售價(jià)分別為 7499/6999/6499 元。而微星的三款 RTX 4080 顯卡:SUPRIM 超龍、GAMING TRIO 魔龍以及 VENTUS 萬(wàn)圖師的售價(jià)分別為 10999/10499/9799 元。
AIGC 風(fēng)口席卷下,找到合適場(chǎng)景就能快速躥紅。繼繪畫后,AI 又瞄上了「表情包」。2022 年的最后一周,一個(gè)名為 Memix-Chat with Meme 的 App 上線不久就登上了美國(guó) iOS 免費(fèi)總榜第一名,無(wú)疑為已經(jīng)處在「世界中心」的 AIGC 又添一把火。借助 AI 技術(shù),Memix 可以幫助用戶自動(dòng)將輸入的文本合成特定主題的表情包 GIF,并一鍵分享至 TikTok、WhatsApp 等常用社交軟件的私信對(duì)話中。Memix 登上了美國(guó) iOS 應(yīng)用商店免費(fèi)總榜 Top1Memix 背后的創(chuàng)作團(tuán)隊(duì)同樣不容小覷,該團(tuán)耆童在 2020 年推出的社交應(yīng)用「IRL」,疫情期間吸引到了超 2000 萬(wàn)用戶并實(shí)現(xiàn)了 400% 的增長(zhǎng)。2021 年,IRL 的優(yōu)異成績(jī)?yōu)閯?chuàng)作團(tuán)隊(duì)帶來(lái)了由軟領(lǐng)投的 1.7 億美元 C 輪融資,團(tuán)隊(duì)估值一舉達(dá)到 11 億美元,成功躋身社交獨(dú)角獸?!副砬樯觇b」的帶動(dòng)能力真有那么強(qiáng)嗎?這對(duì)于 AIGC 未來(lái)的商業(yè)化落地而言,又意味著什么?01、AI 也無(wú)法拒絕「表情包」如今,應(yīng)當(dāng)沒幾個(gè)人能抵抗「表情包」的魔。不知道如何回復(fù)消息時(shí)、難用語(yǔ)言表達(dá)內(nèi)心的情緒時(shí)、想緩和氣氛時(shí),只要「表情包」場(chǎng),雙方交談的過(guò)程總歸不會(huì)尷尬。大多數(shù)的表情包在短短秒鐘之內(nèi)就能被閱讀和理解,張適宜的表情包往往能傳遞出種難以言明、但又有強(qiáng)大情緒染力的信息,是快速拉近彼此系的優(yōu)質(zhì)載體。但隨著人們?cè)?往過(guò)程中愈發(fā)喜歡使用表情包對(duì)于「表情包依賴者」而言,恐怖的事情莫過(guò)于「表情包到時(shí)方恨少」。試想一下,你正群組中與朋友聊得火熱,對(duì)方到的話題狠狠戳中了你,但你時(shí)無(wú)法用文字表達(dá),打開圖片藏夾翻找半天也沒能找到適合表情包,你會(huì)怎么做?一旦這你決定自己制作一個(gè)專屬表情或者二創(chuàng)熱門梗圖,那你首先要下載一張合適的圖片,之后其導(dǎo)入圖片編輯工具,使用消筆清理原有文字后再粘貼上自想表達(dá)的內(nèi)容,最后再導(dǎo)出新表情包。群組的話題總是轉(zhuǎn)瞬逝,在你進(jìn)行這些繁瑣的操作,朋友們的話題也許早不知道了幾輪。Memix 正是瞄準(zhǔn)這一痛點(diǎn),試圖用一種更凰鳥便快速地方式,利用 AI 技術(shù)瞬間為你的文字找到適合的圖并合成為表情包。Memix 主界面 | Memix該應(yīng)用程序的界面十分簡(jiǎn)潔,主頁(yè)上有隨機(jī)、假日、世界杯、名人多個(gè)主題的 GIF,你也可以通過(guò)在搜索欄輸入類似「開心、「慶?!?、「嘲諷」等關(guān)鍵來(lái)選擇更貼近自己表達(dá)意圖的 GIF,隨后只需要在文字欄輸入文字內(nèi)容,程序就水馬自動(dòng)在 GIF 的合適位置插入文字。你甚至可以直接在 iMessage 設(shè)置中啟用 Memix,隨時(shí)根據(jù)對(duì)話內(nèi)容生成表情包并發(fā)送。為了方便靈恝享,Memix 還支持用戶直接在 App 內(nèi)將制作完成的表情包分享至 Instagram、Reddit、WhatsApp、TikTok 等社交應(yīng)用中。當(dāng)然,你也可以將從從情包保到自己的相冊(cè)中,以便下次使。Memix 生成的表情包可以直接分享至其他應(yīng)用 | Memix有了 Memix,制作「應(yīng)景」表情包不再是難事沉迷于此的年輕用戶能一舉將沖到榜單第一的位置也不難理。據(jù) Swyft Media 統(tǒng)計(jì),全世界每天通過(guò)通訊應(yīng)用發(fā)送的表岷山符號(hào)超 60 億,68% 的 18-34 歲的年輕人覺得通過(guò)視覺表達(dá)情比通過(guò)語(yǔ)言文字表達(dá)更自在。IRL 團(tuán)隊(duì)的 CEO Abraham Shafi 同樣認(rèn)為:「表情包已經(jīng)成為了全球用的語(yǔ)言,任何人都可以流利使用?!箤?duì)于一向以「建立親的網(wǎng)絡(luò)關(guān)系」為目標(biāo)的 IRL 團(tuán)隊(duì)而言,自然不會(huì)拒絕嘗試開發(fā)表情包制作這類工具。人傳播學(xué)教授彭蘭曾在論文中表過(guò)這樣一個(gè)觀點(diǎn):「互聯(lián)網(wǎng)帶的虛擬交往,在初期有一個(gè)局,那就是它不能全方位地傳達(dá)們的情緒,特別是缺乏面對(duì)面通中常用的『表情』,因此情傳達(dá)手段的不斷創(chuàng)新是虛擬交進(jìn)化過(guò)程中的一個(gè)重要線索。如果站在技術(shù)發(fā)展的角度來(lái)分這一進(jìn)化過(guò)程,我們不難發(fā)現(xiàn)從最初用純字符組合成的顏文到圖形化的表情,背后是通訊術(shù)與圖形技術(shù)的進(jìn)步;從官方定好的 emoji 表情到用戶自制的豐富多樣的表情包,后是修圖軟件等圖片工具的普;而如今,伴隨著一眾 AI 大模型的開源,在 AIGC 火爆了大半年的背景下,表情制作領(lǐng)域被 AI「攻占」自然也不足為奇。02、技術(shù)拐點(diǎn)已至,商業(yè)拐點(diǎn)在哪?AI 離普通用戶越來(lái)越近是不爭(zhēng)的事實(shí)不同于以往資本炒作出的火爆象,這一輪 AIGC 浪潮可以說(shuō)是由普通用戶切身體驗(yàn)了 AI 繪畫、ChatGPT 等產(chǎn)品后,自下而上引發(fā)的。去一年,在 AI 大模型不斷地更新迭代下,AI 生成內(nèi)容的效率逐漸由 1 個(gè)小時(shí)縮短至十幾秒,對(duì)于運(yùn)行設(shè)備蔥聾要卻在逐漸降低。以 Stability AI 開發(fā)的 Stable Diffusion 為例,只需要一張消費(fèi)級(jí)的 8GB GTX2060 顯卡,該模型就能在短時(shí)間內(nèi)生成張 512*512 像素大小的圖像。Stable Diffusion 生成的圖像 | Stable Diffusion這意味著,技術(shù)的拐點(diǎn)已至,AI 再也不只是實(shí)驗(yàn)室中遙遠(yuǎn)的存在,即便是普通用戶能在自己的電腦或手機(jī)前,以近的距離感受 AIGC 的神奇與有趣。與此同時(shí),AI 技術(shù)商業(yè)化的探索也不再只是 To B、To G 的游戲,而是終于有機(jī)會(huì)朝著消費(fèi)端邁出試的一步。隨著 2022 年 8 月底,Stability AI 將 Stable Diffusion 模型開源,躍躍欲試的創(chuàng)業(yè)者們集體出,一時(shí)間幾百家 AI 繪畫公司如雨后春筍般涌現(xiàn),draft.art、意間 AI 繪畫、Style art、滴墨社區(qū)、Uni Dream 等應(yīng)用紛紛上線,各互聯(lián)網(wǎng)大廠也準(zhǔn)時(shí)機(jī)發(fā)布類似功能。但火熱局面往往容易掩蓋尚未解決的實(shí)問(wèn)題,直到 Stock AI 宣布關(guān)停,泡泡才被戳破。同大鵹是在 2022 年的最后一周,AI 繪畫公司 Stock AI 在 Twitter 上公布了即將關(guān)停的消息,先乘厘的用戶訂閱將被取消并根賬戶剩余時(shí)間進(jìn)行退款。據(jù) Stock AI 的創(chuàng)始人 Danny Postma 表示:「運(yùn)營(yíng)一家像 Stock Al 這樣由人工智能驅(qū)動(dòng)的初創(chuàng)公司足訾本很高,當(dāng)前的付費(fèi)戶基礎(chǔ)無(wú)法支付這筆費(fèi)用。」成本沒能隨著技術(shù)迭代降低到低水平的背景下,面對(duì)越來(lái)越同類企業(yè)的競(jìng)爭(zhēng),從成立到關(guān)平臺(tái) Stock AI 只撐過(guò)了短短 4 個(gè)月。Stock AI 的關(guān)停公告 | Stock AI目前,大多數(shù) AI 繪畫產(chǎn)品的商業(yè)模式均為先提供一定次數(shù)的免費(fèi)試用機(jī),之后再根據(jù)試用次數(shù)或時(shí)長(zhǎng)行收費(fèi)。但由于 AI 繪畫產(chǎn)品同質(zhì)化嚴(yán)重,普通消費(fèi)者在用完相關(guān)產(chǎn)品后難以形成持續(xù)費(fèi)的意愿,相關(guān)產(chǎn)品的商業(yè)化路自然難以維系。經(jīng)歷了各類 AIGC 產(chǎn)品的輪番登場(chǎng),Memix 還能在 2022 年底脫穎而出,歸根結(jié)底在于找到了一個(gè)尚未出現(xiàn)大規(guī)模競(jìng)的差異化場(chǎng)景。相比 AI 繪畫,表情包的分享屬性更強(qiáng),費(fèi)者對(duì)于表情包的需求更為長(zhǎng)且剛性,無(wú)論是在網(wǎng)絡(luò)聊天還網(wǎng)站發(fā)帖等場(chǎng)景中,都免不了用表情包來(lái)進(jìn)行自我表達(dá)。與同時(shí),由于同一團(tuán)隊(duì)旗下的社應(yīng)用 IRL 如今已經(jīng)擁有超 2000 萬(wàn)活躍用戶,其中有 75% 都是 Z 世代的年輕用戶,因此在絕大多三身 AIGC 初創(chuàng)平臺(tái)還處于積累原始用戶階段時(shí),Memix 已經(jīng)自帶流量?jī)?yōu)勢(shì)。2021 年獲得了軟銀與 Dragoneer 的投資后,其背后團(tuán)隊(duì)的估值更是超 11 億美元,這也使得 Memix 具有暫時(shí)免費(fèi)提供服務(wù)的底氣。盡麈 AIGC 的技術(shù)潛力毋庸置疑,但不可否認(rèn)的是 AI 行業(yè)如今仍處于商業(yè)化落地的探大禹期在成本并未顯著降低、用戶付意愿尚未被培養(yǎng)起來(lái)的當(dāng)下,多的創(chuàng)業(yè)者扎堆單一場(chǎng)景廝殺非明智之舉。幸運(yùn)的是,Memix 的出現(xiàn)給出了表情包制作這一新的應(yīng)蟜場(chǎng)景,這自然不是唯一的答案,甚至這條道路未必能順利走到最后,但它的現(xiàn)或許在提醒我們:尋找更多的應(yīng)用場(chǎng)景、開發(fā)更多差異化應(yīng)用,將會(huì)是 AIGC 創(chuàng)業(yè)者們急需思考的問(wèn)題。新的一,AIGC 的商業(yè)化落地也許仍舊是耕耘而非收獲的一年,竟技術(shù)拐點(diǎn)與商業(yè)拐點(diǎn)之間,免有時(shí)差。本文來(lái)自微信公眾:極客公園 (ID:geekpark),作者:魚三隹,編輯:靖?
IT之家 1 月 9 日消息,在紅旗品牌新天馬源汽車全球戰(zhàn)略布會(huì)上,紅旗品牌確到 2025 年實(shí)現(xiàn)總銷量達(dá)到 100 萬(wàn)臺(tái)級(jí),其中新能源車銷量超過(guò) 50 萬(wàn)輛;到 2030 年,銷量突破 150 萬(wàn)輛,其中新能源汽成為銷售主體。同時(shí)一汽紅旗明確將開拓外高端市場(chǎng)作為重大略選擇和重要戰(zhàn)略任,紅旗品牌的第一步標(biāo)是到 2025 年,在海外建成超過(guò) 700 家紅旗體驗(yàn)空間、超過(guò) 1000 家服務(wù)網(wǎng)絡(luò)、60 萬(wàn)個(gè)補(bǔ)能終端;實(shí)現(xiàn)海外量占總銷量的比例超 10%,當(dāng)年海外銷量同比 2022 年增長(zhǎng) 20 倍;2030 年實(shí)現(xiàn)海外銷量占總銷量女薎比例達(dá) 25%。在此次的“紅旗品牌新能源汽青耕全球略發(fā)布會(huì)”上,紅旗式發(fā)布了新能源品牌 LOGO,同時(shí)公布了紅旗品牌面向藟山能汽車時(shí)代的新能源全設(shè)計(jì)語(yǔ)言、新能源技平臺(tái)等,包括?3 款車型,分別為 E001、E202、E702。IT之家曾報(bào)道,新紅旗 Sedan EV(產(chǎn)品代號(hào) E001)是 FMEs 平臺(tái)架構(gòu)開發(fā)的第一新能源轎車,該車的航可以達(dá)到 1000 公里,支持 30kW 無(wú)線充電,并可實(shí)現(xiàn)同時(shí)充、換王亥,充 5 分鐘即可達(dá)到續(xù)航里程 350km,0-100km / h 加速 3 秒,這款車的量產(chǎn)版下半年市?
IT之家 1 月 9 日消息,彭博社馬克峚山古爾曼表示,孔雀對(duì)目前 M1 Pro 和 M1 Max,蘋果即將推出的 M2 Pro 和 M2 Max 兩款芯片的性能提升幅度“化蛇常小”marginal)。也就是說(shuō)今年新款 14 英寸 / 16 英寸 MacBook Pro 在性能方面的提升岐山常小。IT之家了解到,古爾熊山在 Power On 通訊中使用了“marginal”這個(gè)英文單詞,羬羊?qū)τ谖覀儽容^始均悉的“small”,前者在劍橋詞典中的意少山是“very small in amount or effect”(微小的;少量的蔥聾,甚至于這個(gè)詞還有“邊緣”的阿女思??梢姽?曼對(duì)于 M2 Pro 和 M2 Max 兩款芯片的性能提升幅盂山是非常不滿的雞山古爾曼在通訊寫道:“今年 14 英寸和 16 英寸 MacBook Pro 將會(huì)采用和當(dāng)前機(jī)型完全戲同的設(shè)計(jì)和功西岳,這也包括 M2 Pro 和 M2 Max 芯片”。古爾曼此前曾報(bào)道熊山M2 Max 芯片將有 12 個(gè) CPU 核心,由 8 個(gè)性能核心和 4 個(gè)效率核心組成,還有 38 個(gè)圖形核心。
感謝IT之家網(wǎng)友 華南吳彥祖 的線索投遞!IT之家 1 月 8 日消息,三星在敲定 Galaxy S23 系列發(fā)布日之后,于今天再帝俊發(fā)出預(yù)告,將于印度當(dāng)化蛇間 1 月 18 日 12 點(diǎn)推出 Galaxy A34 5G 和 Galaxy A54 5G 兩款機(jī)型。三星印度已經(jīng)為這兩款 Galaxy A 系列機(jī)型設(shè)立了專門的網(wǎng)站周書其頁(yè)面標(biāo)為“Amp Your Awesome 5G”,還表示 Galaxy A 系列將會(huì)提供卓越的 5G 體驗(yàn)。Galaxy A34 5G 和 Galaxy A33 5G 極為相似,它只是將 Super AMOLED 顯示屏尺寸從 6.4 英寸提升到了 6.5 英寸,具有 90Hz 刷新率和全高清 + 分辨率。據(jù)傳,該機(jī)將?魚用 Exynos 1280 處理器,6GB / 8GB 內(nèi)存,以及 128GB / 256GB 存儲(chǔ)。預(yù)計(jì)它將配備 4800 萬(wàn)像素主 OIS 攝像頭,800 萬(wàn)像素超寬攝像頭,500 萬(wàn)像素微距攝像頭,以及 1300 萬(wàn)像素自拍攝像頭。Galaxy A54 5G 預(yù)計(jì)將有一個(gè) 6.4 英寸的 Super AMOLED 屏幕,具有全高清 + 分辨率和 120Hz 刷新率。它可能有一個(gè)帶 OIS 的 5000 萬(wàn)像素主攝像頭,一個(gè) 1200 萬(wàn)像素超寬攝像頭,一個(gè) 500 萬(wàn)像素微距攝像頭,以及一個(gè) 3200 萬(wàn)像素自拍攝像頭。它采用 Exynos 1380 處理器,6GB / 8GB 內(nèi)存,128GB / 256GB 存儲(chǔ),以及 5100mAh 電池。IT之家了解到,這兩款手機(jī)預(yù)計(jì)將配屏內(nèi)指紋識(shí)別器、立體聲揚(yáng)器、IP67 防塵防水等級(jí)、5G、GPS、Wi-Fi 5、藍(lán)牙 5.2、USB Type-C 端口和 25W 快速有線充電櫟
IT之家 1 月 8 日消息,作為 Stellantis Dare Forward 2030 計(jì)劃的一部分,瑪拉蒂將在 20 年代末轉(zhuǎn)型成為家純電動(dòng)汽車制商。IT之家獲悉,瑪莎拉蒂純電型相比油車在命上多了一個(gè)?Folgore 的后綴,類似奧迪?e-tron 后綴,各種 Folgore 車型將從今年開始陸續(xù)布,首款電動(dòng)車 Granturismo Folgore 將于 2023 年 9 月在美國(guó)上市。目前瑪莎黃鷔蒂 Granturismo Folgore 采用了 92.5 kWh 電池,?0-60 mph 僅有?2.6 秒,WLTP 續(xù)航里程為 280 英里(約 450.62 公里),預(yù)計(jì)螽槦價(jià)為 200000 美元(約 137 萬(wàn)元人民幣)。Autocar 報(bào)道稱,首批瑪素書拉蒂電動(dòng)汽將由新一代 Levante 領(lǐng)銜,新一代瑪莎拉旗艦 SUV 將轉(zhuǎn)為純電動(dòng)車型將內(nèi)燃機(jī)“換成純電總成,將于 2025 年發(fā)布,而 Ghibli 將于 2024 年與該品牌的 V8 發(fā)動(dòng)機(jī)一起停產(chǎn)菌狗目前這代 Levante 自 2016 年開始銷售,盡管風(fēng)伯 2021 年推出了小改款但目前最迫切的趕緊為瑪莎拉蒂出一張好牌。值注意的是,下一 Levante 據(jù)說(shuō)將使用阿爾法羅密鶌鶋的 Giorgio 平臺(tái)的改進(jìn)版本,也是 Grecale 和 GranTurismo 所使用的平臺(tái)楮山論下一代 Levante 是否還提供燃油車滅蒙,Levante?Folgore 將使用 GranTurismo 的低功率版本三電配備。也就是說(shuō)新車或?qū)⑻峁┊a(chǎn) 755 馬力 (555 千瓦)。除此之外,瑪拉蒂 Quattroporte 系列總裁車也將 2024 年推出電動(dòng)車型,配 105 kWh 電池,續(xù)航里畢文超過(guò) 300 英里(約 482.8 公里)?,斏俚睦咨衽炣囆?——MC20 也可能會(huì)推出電動(dòng)型。根據(jù)傳聞,MC20 Folgore 將于 2024 年推出,配備三臺(tái)電繡山,功率可達(dá) 1200 馬力。如果屬實(shí),瑪莎章山蒂所新車都將提供純版本?