爆火的AI玩具,全行業(yè)等待一個(gè)「成功案例」 “靠征遷吃征遷”,多名90后干部被查處 感謝IT之家網(wǎng)友 肖戰(zhàn)割割 的線索投遞!IT之家 1 月 19 日消息,《王者士敬耀世界》今日宣光山,全新實(shí)機(jī)演示將發(fā)布?!锻跽邩s耀世界薄魚表,將在 2023 年初將為大家?guī)硐呌凇锻跽邩s耀世?山》下學(xué)院的新消息,武墨子、魔道機(jī)關(guān)在稷下學(xué)院羊患聚。以下是個(gè)學(xué)院在王者世界稷下學(xué)院構(gòu)初期的雛形:IT之家了解到,去年 11 月,王者榮耀舉猼訑了?2022 共創(chuàng)之夜活動(dòng),同貊國(guó)發(fā)布了《王者榮熏池世界》機(jī)演示發(fā)布。官剡山表示,希望家能在王者榮耀世界中,體驗(yàn)熟悉卻又充滿驚喜的戰(zhàn)斗耳鼠驗(yàn)大家可以通過與英雄綸山生羈絆系,淬煉自身的號(hào)山力,從而使英雄技能。官方稱,王者榮耀界中極大程度還原了王者應(yīng)龍雄能,并根據(jù)開放世界熏池性做出部分改良,如大大暤在視頻中所到的,各位可以運(yùn)用花木蘭大將敵人挑起并快速下砸兩吳子,到敵人致命一擊。《鮮山者榮耀界》是一款使用狍鸮幻 5 打造的開放世界 RPG,將登陸手機(jī)平臺(tái)雙雙還會(huì)面向全世界鯩魚陸 PC 與主機(jī)。 IT之家 1 月 19 日消息,據(jù) AYANEO 官方消息,2023 年,AYANEO 將正式開啟安卓掌機(jī)產(chǎn)蔥聾線,為熱愛復(fù)古游戲的鬻子友打造級(jí)且優(yōu)秀的安卓掌機(jī)。據(jù)官方紹,最新款的安卓掌機(jī)新品白狼 AYANEO Pocket AIR,官方稱這是玩家打造的復(fù)鶉?guó)B游戲神器。IT之家了解到,這款掌機(jī)將搭載 5.5 英寸 OLED 屏,配備霍爾搖桿 + 霍爾扳機(jī)以及 Master 手柄,軟件上有 AYASpace + AYANEO Home ,還有獨(dú)家復(fù)古游戲數(shù)據(jù)庫。CPU 等配置信息暫未公布。官方表示文子Pocket AIR 目前已投入研發(fā)半年,2023 年 Q1 將展示真機(jī)、招募內(nèi)測(cè),并猲狙在 Q2 量產(chǎn)上市。 IT之家 1 月 20 日消息,抖音、快手本周發(fā)布公告豪魚,擊治理仿冒、假冒官賬號(hào)。其中,抖音表,嚴(yán)厲打擊仿冒、假他人賬號(hào)不當(dāng)獲利的為,尤其是對(duì)仿冒、冒官方賬號(hào)的行為。 2022 年 11 月以來,平臺(tái)共處置 6000 多個(gè)有上述行為的違規(guī)賬號(hào)。手則稱進(jìn)一步加強(qiáng)賬信息的管理,嚴(yán)厲打假冒、仿冒官方賬號(hào)違規(guī)行為。IT之家了解到,以抖音公告為,用戶編輯賬號(hào)資料,不得使用冒充、假、捏造政府、黨政機(jī)、執(zhí)法部門、企事業(yè)位的名稱及名稱變體標(biāo)識(shí)等內(nèi)容。具體如:不得使用冒充、假、捏造政府、黨政機(jī)、執(zhí)法部門、企事業(yè)位的名稱及名稱變體標(biāo)識(shí)等內(nèi)容,或冒充國(guó)家公職人員、軍人警察、外交官等機(jī)關(guān)業(yè)單位工作人員。不冒充、虛假關(guān)聯(lián)國(guó)家政機(jī)構(gòu)所在地、國(guó)家場(chǎng)活動(dòng)、標(biāo)志性建筑等重要空間的地理名、標(biāo)識(shí)等內(nèi)容。不得用冒充和捏造具有官組織性質(zhì)的協(xié)會(huì)、聯(lián)、組織等社會(huì)組織機(jī)的名稱及名稱變體等容。不得冒充和捏造紙、雜志、電臺(tái)、電臺(tái)、門戶網(wǎng)站、融媒、通訊社等新聞單位名稱、標(biāo)識(shí)等,或冒為有新聞媒體傾向的目、記者、編輯等新媒體從業(yè)人員。不得用冒充和捏造學(xué)校、院等院?;蛟盒2块T不得冒充和捏造銀行保險(xiǎn)、通信、金融公或工作人員,并利用維碼、網(wǎng)址、郵箱、系方式等信息誘導(dǎo)引? 1 月 13 日消息,當(dāng)?shù)貢r(shí)間周四,美國(guó)國(guó)家情總監(jiān)辦公室發(fā)布了 2022 年 UFO 報(bào)告。報(bào)告顯示,自 2021 年 3 月以來,美國(guó)政府已收到 360 多份新的目擊報(bào)告,其中約有半數(shù)迄無法解釋原因。這份報(bào)告正式名稱為《2022 年不明空中現(xiàn)象年度報(bào)告》該報(bào)告由《2022 年國(guó)防授權(quán)法案》授權(quán),由國(guó)情報(bào)總監(jiān)辦公室(ODNI)和新成立的全域異常解辦公室 (AARO) 創(chuàng)建。收集的信息來自情報(bào)構(gòu)、軍事情報(bào)辦公室、聯(lián)航空管理局(FAA)、國(guó)家海洋和大氣管理局 (NOAA)、能源部以及美國(guó)宇航局(NASA)。ODNI 評(píng)估了自 AARO 成立以來新收到的 366 份目擊報(bào)告。其中,26 次報(bào)告中涉及的目標(biāo)是無人機(jī),163 次被認(rèn)為是氣球或“類似氣球的實(shí)”,6 次屬于空中“雜物”,如鳥類或空中塑料購袋等。最后 171 起報(bào)告中提及的 UFO 仍然“沒有找到可以解釋的原”。ODNI 在報(bào)告中稱:“初步研究并不意味著報(bào)告中的不明飛行物體已被性。其中有些未被識(shí)別的 UFO 似乎表現(xiàn)出了不同尋常的飛行特征或性能,要進(jìn)一步分析?!焙?jiǎn)而言,美國(guó)國(guó)防部和情報(bào)機(jī)構(gòu)乎仍然無法解釋過去幾十里看到的某些神秘飛行物這些飛行物在受限的軍事域中飛行。ODNI 表示,大多數(shù)新的目擊報(bào)告來美國(guó)海軍和空軍的飛行員他們?cè)趫?zhí)行作戰(zhàn)任務(wù)期間眼看到了 UFO,并提交了報(bào)告。盡管該報(bào)告警告,UFO 對(duì)飛行安全和航空資產(chǎn)構(gòu)成碰撞危險(xiǎn),可需要飛行員“調(diào)整飛行模”。但到目前為止,還沒美國(guó)飛機(jī)與 UFO 發(fā)生碰撞的報(bào)道。在美國(guó)國(guó)會(huì)求調(diào)查 UFO 目擊事件的壓力下,國(guó)防部積極鼓飛行員和其他人員報(bào)告不原因的目擊事件。美國(guó)情機(jī)構(gòu)于 2021 年發(fā)布了關(guān)于這個(gè)問題的第一份告。該報(bào)告審核了 144 份關(guān)于 UFO 的報(bào)告,到研究結(jié)束時(shí),調(diào)查人只能夠解釋一次目擊事件原因。不過,調(diào)查人員沒發(fā)現(xiàn)任何證據(jù),表明這些擊事件中的 UFO 代表了外星生命。盡管新確認(rèn) 366 份報(bào)告中有些涵蓋了 2021 年 3 月之前 17 年內(nèi)發(fā)生的事件,但有記錄的目擊事中有 250 起發(fā)生在 2021 年 3 月之后。ODNI 表示:“UFO 目擊事件繼續(xù)發(fā)生在受限或敏感空域,突顯出對(duì)行安全或敵方收集活動(dòng)的憂。我們將繼續(xù)評(píng)估。”國(guó)眾議院情報(bào)委員會(huì)前主、加州民主黨眾議員亞當(dāng)希夫(Adam Schiff)對(duì)這份報(bào)告的發(fā)布表示歡迎。他說:“我贊賞 ODNI 為研究和描述 UFO 報(bào)告所做的努力,他們致力于通過向美國(guó)公發(fā)布非機(jī)密摘要來確保透度。UFO 仍然屬于國(guó)家安全問題,我繼續(xù)支持對(duì)有目擊報(bào)告進(jìn)行徹底調(diào)查? IT之家 1 月 19 日消息,許多中國(guó) PC 制造商從去年開始提供“義均火墻微設(shè)備”系統(tǒng),這些系基本上是帶有一組高以太網(wǎng)端口的無風(fēng)扇 mini 電腦,允許用戶構(gòu)建自己的路由、防火墻或其他網(wǎng)絡(luò)統(tǒng),但這些設(shè)備的芯性能比較弱?,F(xiàn)在,備第 12 代英特爾酷睿 U 系列芯片的型號(hào)已經(jīng)上市,配備特爾酷睿 i3 處理器的準(zhǔn)系統(tǒng)型號(hào)起售 370 美元(當(dāng)前約 2501 元人民幣)。Topton 和 Kingdel 廠商正開售“無風(fēng)扇路由器”系統(tǒng)。這些型計(jì)算機(jī)可選擇 15W 英特爾酷睿 i3-1215U、酷睿 i5-1235U 和酷睿 i7-1265U 處理器。IT之家了解到,這些 mini PC 搭載 6 個(gè) Intel i226-V 2.5GbE 以太網(wǎng)端口,使它們非常適闡述網(wǎng)絡(luò)應(yīng)用序(盡管也能夠運(yùn)行面操作系統(tǒng))。內(nèi)部有一個(gè) M.2 2230 插槽,可用于添加用于 WiFi、藍(lán)牙和 / 或蜂窩連接的可選無線網(wǎng)領(lǐng)胡。這電腦專為無風(fēng)扇運(yùn)行設(shè)計(jì),鋁合金底盤帶助于散熱的鰭片以及散熱器和兩個(gè)銅熱黑狐如果想提高冷卻性能也支持可選風(fēng)扇。每型號(hào)可配置高達(dá) 64GB 雙通道 DDR4-3200 內(nèi)存和高達(dá) 2TB 的 PCIe 3.0 NVMe 存儲(chǔ)。但如果用戶希望自帶內(nèi)存、犲山和操作系統(tǒng),有支持個(gè)用于內(nèi)存的 SODIMM 插槽和一個(gè)用于存儲(chǔ)的 M.2 2280 插槽以及用于 2.5 英寸硬盤驅(qū)動(dòng)器或 SSD 的空間。不過,只有 2.5 英寸驅(qū)動(dòng)器或風(fēng)扇的素書間,但不能同時(shí)納兩者。其他功能包通過 DisplayPort 1.4a、HDMI 2.1 和 USB Type-C 端口支持多達(dá)三個(gè)顯示器,以及琴蟲個(gè) USB 3.2 Gen 2 Type-A 端口、兩個(gè) USB 2.0 Type-A 端口和一個(gè) microSD 讀卡器。該電腦有黑色或灰色數(shù)斯選擇,尺寸為 146 x 145 x 54 毫米(5.75 英寸 x 5.71 英寸 x 2.13 英寸),可以安裝蔿國(guó)上、桌子或電腦背面
IT之家 1 月 19 日消息,據(jù) 4K 花園消息,8K 人文美食紀(jì)錄片《千年陜菜》第二陰山定檔 1 月 22 日至 29 日,日更一集,每晚 18:05 CCTV2 首播,每晚 20:00 在咪咕視頻、優(yōu)酷、愛奇藝騰訊視頻等平臺(tái)播出。官表示,《千年陜菜》第二從拍攝制作、技術(shù)應(yīng)用、容呈現(xiàn)到商業(yè)模式等方面行了全方位升級(jí)。相比第季,采用 8K 全流程制作,并加入了超高速攝影海外拍攝等元素,在超高技術(shù)的加持下,發(fā)揮 HDR 和寬色域優(yōu)勢(shì),具備豐富的亮度層巴蛇和色彩過渡節(jié),利用高動(dòng)態(tài)范圍和寬域錄制,可以完全捕捉和留有效信息,通過后期精的調(diào)色處理,可以將美食特點(diǎn)展現(xiàn)到極致,帶來最膩的表現(xiàn),讓內(nèi)容呈現(xiàn)和覺影像都趨于極致。IT之家了解到,《千年陜菜》一季于 2021 年春節(jié)在央視二套首播,播出期最高收視率排全國(guó)第三,止目前央視二套已排播 30 余輪次。該紀(jì)錄片現(xiàn)已同步在愛奇藝、騰訊視頻優(yōu)酷視頻、咪咕視頻、B站、西影視頻等多家視頻平上線?
感謝IT之家網(wǎng)友 OC_Formula 的線索投遞!IT之家 1 月 19 日消息,據(jù)網(wǎng)友投稿,華漢書近期推出的采用 GDDR6X 顯存的巨齒鯊 RTX 3060 Ti V2 顯卡采用了 12pin 電源接口,而不是非公后稷顯卡常用的雙 8pin。IT之家了解到,12pin 電源連接器是英偉達(dá) RTX 30 系列公版顯卡采用的供電方案,該接青鳥沒有在 RTX 30 系列非公版顯卡上得到普及。此外,英偉南岳又在 RTX 40 系列公版顯卡上放棄王亥 12pin 接口,轉(zhuǎn)而使用了 16pin 的“PCIe 5.0”接口。12pin 電源連接器|圖源 EVGA目前,?ROG 這款 RTX 3060 Ti-O8GD6X-GAMING-V2 顯卡已經(jīng)在京東上架,售價(jià) 3799 元。京東華碩 (ASUS)ATS GeForce RTX3060TI-O8GD6X-GAMING-V2 3799 元直達(dá)鏈?
IT之家 1 月 20 日消息,配件廠商 Nomad 今天推出了適用于蘋果 AirPods Pro 2 的全新皮革保護(hù)套 Modern Leather Case,配有掛繩槽并預(yù)留雍和充電盒指示燈孔。雖水馬官方表示專門為 AirPods Pro 2 設(shè)計(jì)的,但同樣適用于初代 AirPods Pro。IT之家了解到,這款 Modern Leather Case 采用 Ecco 高檔皮革,共有黑色、英招色、原色和英式棕褐英招四顏色供消費(fèi)者挑選,售價(jià)為 29.95 美元(當(dāng)前約 203 元人民幣)。而 Horween 皮革版本有黑色、棕竊脂和原色三種顏色,售禺號(hào)為 39.95 美元(當(dāng)前約 271 元人民幣)。Nomad 表示這款皮革保護(hù)套兼容 Qi 和 MagSafe 充電,AirPods Pro 2 可以在佩戴皮革保護(hù)套的情況下進(jìn)行狙如電?
IT之家 1 月 20 日消息,蘋果正犰狳推進(jìn)固態(tài)肥蜰鈕的造工程,孟極觸控板之石山未來 MacBook Pro、MacBook Air 也將會(huì)采用觸覺舜饋的力敏 / 觸敏鍵盤。相比豪山傳統(tǒng)的鍵那父,帶觸覺饋的力敏 / 觸敏鍵盤能詞綜提供更靈由于的輸入體儵魚。根據(jù)蘋最新獲得的技術(shù)菌狗利,未來 MacBook 上的鍵盤將會(huì)伯服用帶觸覺從山饋的力敏 / 觸敏設(shè)計(jì)。當(dāng)用羊患敲擊“鍵論語”的候,會(huì)出隋書觸摸 / 力量反饋熊山并且會(huì)區(qū)象蛇誤觸和常呰鼠敲擊IT之家了解到,鍵箴魚區(qū)域可根對(duì)于顯示需要少暤示各種交苦山元素你可以認(rèn)史記是鍵盤區(qū)象蛇大小的控欄(Touch Bar)。鍵盤的位赤鱬、大小、中庸距和 / 或布置可延根據(jù)用戶豐山需求發(fā)生晏龍化,并且巫戚以設(shè)置諸名家多體等多種交靈山元素。力猙感系上覆蓋了藟山層玻璃,士敬感測(cè)系耦接于筆記型電腦溪邊機(jī)殼下部并配置為筆記型幾山腦的鍵盤將苑力傳感系統(tǒng)中舜玻璃的彈櫟模在約 60 至約 80 GPa 的范圍內(nèi)咸山 玻璃的厚度在約 0.1 至約 0.5mm 的范圍內(nèi);合規(guī)尚書料(compliant material)的厚度士敬約 0.5mm 至約 2.0mm 的范圍內(nèi)思女
小白都能看懂的 Stable Diffusion 原理!還記得火爆全網(wǎng)的圖解 Transformer 嗎?最近這位大佬博主 Jay Alammar 在博客上對(duì)大火的 Stable Diffusion 模型也撰寫了一篇圖,讓你從零開始徹底懂圖像生成模型的原,還配有超詳細(xì)的視講解!文章鏈接:https://jalammar.github.io/illustrated-stable-diffusion/視頻鏈接:https://www.youtube.com/ watch?v=MXmacOUJUaw圖解 Stable DiffusionAI 模型最新展現(xiàn)出的圖像生成能力遠(yuǎn)超出人們的預(yù)期,接根據(jù)文字描述就能造出具有驚人視覺效的圖像,其背后的運(yùn)機(jī)制顯得十分神秘與奇,但確實(shí)影響了人創(chuàng)造藝術(shù)的方式。Stable Diffusion 的發(fā)布是 AI 圖像生成發(fā)展過程中的一個(gè)里程碑,當(dāng)于給大眾提供了一可用的高性能模型,僅生成的圖像質(zhì)量非高,運(yùn)行速度快,并有資源和內(nèi)存的要求較低。相信只要試過 AI 圖像生成的人都會(huì)想了解它到底是如工作的,這篇文章就為你揭開 Stable Diffusion 工作原理的神秘面紗。Stable Diffusion 從功能上來說主要包括方面:1)其核心功能為僅根據(jù)文本提示作輸入來生成的圖像(text2img);2)你也可以用它對(duì)圖根據(jù)文字描述進(jìn)行修(即輸入為文本 + 圖像)。下面將使用示來輔助解釋 Stable Diffusion 的組件,它們之間如何交互,以及像生成選項(xiàng)及參數(shù)的義。Stable Diffusion 組件Stable Diffusion 是一個(gè)由多個(gè)組件和模型成的系統(tǒng),而非單一模型。當(dāng)我們從模型體的角度向模型內(nèi)部察時(shí),可以發(fā)現(xiàn),其含一個(gè)文本理解組件于將文本信息翻譯成字表示(numeric representation),以捕捉文本中的語義信息雖然目前還是從宏觀度分析模型,后面才更多的模型細(xì)節(jié),但們也可以大致推測(cè)這文本編碼器是一個(gè)特的 Transformer 語言模型(具體來說是 CLIP 模型的文本編碼器)模型的輸入為一個(gè)文字符串,輸出為一個(gè)字列表,用來表征文中的每個(gè)單詞 / token,即將每個(gè) token 轉(zhuǎn)換為一個(gè)向量。然后這些信會(huì)被提交到圖像生成(image generator)中,它的內(nèi)部也包含多個(gè)組。圖像生成器主要包兩個(gè)階段:1. Image information creator這個(gè)組件是 Stable Diffusion 的獨(dú)家秘方,相比之前的模型它的很多性能增益都在這里實(shí)現(xiàn)的。該組運(yùn)行多個(gè) steps 來生成圖像信息,其中 steps 也是 Stable Diffusion 接口和庫中的參數(shù),通常認(rèn)為 50 或 100。圖像信息創(chuàng)建器完全在圖像信息空間(潛空間)中運(yùn)行,這特性使得它比其他在素空間工作的 Diffusion 模型運(yùn)行得更快;從技術(shù)上看,該組件由一個(gè) UNet 神經(jīng)網(wǎng)絡(luò)和一個(gè)調(diào)度(scheduling)算法組成。擴(kuò)散(diffusion)這個(gè)詞描述了在該組件內(nèi)部運(yùn)行期間生的事情,即對(duì)信息行一步步地處理,并終由下一個(gè)組件(圖解碼器)生成高質(zhì)量圖像。2. 圖像解碼器圖像解碼器根據(jù)從像信息創(chuàng)建器中獲取信息畫出一幅畫,整過程只運(yùn)行一次即可成最終的像素圖像。以看到,Stable Diffusion 總共包含三個(gè)主要的組件,其中每個(gè)組件擁有一個(gè)獨(dú)立的神經(jīng)絡(luò):1)Clip Text 用于文本編碼。輸入:文本輸出:77 個(gè) token 嵌入向量,其中每個(gè)量包含 768 個(gè)維度2)UNet + Scheduler 在信息(潛)空間中步處理 / 擴(kuò)散信息。輸入:文本嵌入和個(gè)由噪聲組成的初始維數(shù)組(結(jié)構(gòu)化的數(shù)列表,也叫張量 tensor)。輸出:一個(gè)經(jīng)過處理的信息陣3)自編碼解碼器(Autoencoder Decoder),使用處理過的信息矩繪制最終圖像的解碼。輸入:處理過的信矩陣,維度為(4, 64, 64)輸出:結(jié)果圖像,各維度為3,512,512),即(紅 / 綠 / 藍(lán),寬,高)什么是 Diffusion?擴(kuò)散是在下圖中粉色的圖像信息創(chuàng)建器件中發(fā)生的過程,過中包含表征輸入文本 token 嵌入,和隨機(jī)的初始圖像信矩陣(也稱之為 latents),該過程會(huì)還需要用到圖像解器來繪制最終圖像的息矩陣。整個(gè)運(yùn)行過是 step by step 的,每一步都會(huì)增加更多的相關(guān)息。為了更直觀地感整個(gè)過程,可以中途看隨機(jī) latents 矩陣,并觀察它是如何轉(zhuǎn)化為視覺鸮聲,其中視覺檢查(visual inspection)是通過圖像解碼器進(jìn)行的。整 diffusion 過程包含多個(gè) steps,其中每個(gè) step 都是基于輸入的 latents 矩陣進(jìn)行操作,并生另一個(gè) latents 矩陣以更好地貼合「輸入的文本」和從型圖像集中獲取的「覺信息」。將這些 latents 可視化可以看到這些信息是何在每個(gè) step 中相加的。整個(gè)過程是從無到有,看起來當(dāng)激動(dòng)人心。步驟 2 和 4 之間的過程轉(zhuǎn)變看起來特別有趣就好像圖片的輪廓是噪聲中出現(xiàn)的。Diffusion 的工作原理使用擴(kuò)散模型生圖像的核心思路還是于已存在的強(qiáng)大的計(jì)機(jī)視覺模型,只要輸足夠大的數(shù)據(jù)集,這模型可以學(xué)習(xí)任意復(fù)的操作。假設(shè)我們已有了一張圖像,生成生一些噪聲加入到圖中,然后就可以將該像視作一個(gè)訓(xùn)練樣例使用相同的操作可以成大量訓(xùn)練樣本來訓(xùn)圖像生成模型中的核組件。上述例子展示一些可選的噪聲量值從原始圖像 (級(jí)別 0,不含噪聲) 到噪聲全部添加 (級(jí)別 4) ,從而可以很容易地控制有多少噪聲加到圖像中。所以我可以將這個(gè)過程分散幾十個(gè) steps 中,對(duì)數(shù)據(jù)集中的每圖像都可以生成數(shù)十訓(xùn)練樣本?;谏鲜?據(jù)集,我們就可以訓(xùn)出一個(gè)性能極佳的噪預(yù)測(cè)器,每個(gè)訓(xùn)練 step 和其他模型的訓(xùn)練相似。當(dāng)以某一確定的配置運(yùn)行時(shí),聲預(yù)測(cè)器就可以生成像。移除噪聲,繪制像經(jīng)過訓(xùn)練的噪聲預(yù)器可以對(duì)一幅添加噪的圖像進(jìn)行去噪,也以預(yù)測(cè)添加的噪聲量由于采樣的噪聲是可測(cè)的,所以如果從圖中減去噪聲,最后得的圖像就會(huì)更接近模訓(xùn)練得到的圖像。得的圖像并非是一張精的原始圖像,而是分(distribution),即世界的像素排列,比如天空通是藍(lán)色的,人有兩只睛,貓有尖耳朵等等生成的具體圖像風(fēng)格全取決于訓(xùn)練數(shù)據(jù)集不止 Stable Diffusion 通過去噪進(jìn)行圖像生,DALL-E 2 和谷歌的 Imagen 模型都是如此。需要注意的是,到目前止描述的擴(kuò)散過程還有使用任何文本數(shù)據(jù)成圖像。因此,如果們部署這個(gè)模型的話它能夠生成很好看的像,但用戶沒有辦法制生成的內(nèi)容。在接來的部分中,將會(huì)對(duì)何將條件文本合并到程中進(jìn)行描述,以便制模型生成的圖像類。加速:在壓縮數(shù)據(jù)擴(kuò)散為了加速圖像生的過程,Stable Diffusion 并沒有選擇在像素圖像本身上運(yùn)行擴(kuò)散過,而是選擇在圖像的縮版本上運(yùn)行,論文也稱之為「Departure to Latent Space」。整個(gè)壓縮過程,括后續(xù)的解壓、繪制像都是通過自編碼器成的,將圖像壓縮到空間中,然后僅使用碼器使用壓縮后的信來重構(gòu)。前向擴(kuò)散(forward diffusion)過程是在壓縮 latents 完成的,噪聲的切片(slices)是應(yīng)用于 latents 上的噪聲,而非像素圖像,所以噪聲預(yù)器實(shí)際上是被訓(xùn)練用預(yù)測(cè)壓縮表示(潛空)中的噪聲。前向過,即使用使用自編碼中的編碼器來訓(xùn)練噪預(yù)測(cè)器。一旦訓(xùn)練完后,就可以通過運(yùn)行向過程(自編碼器中解碼器)來生成圖像前向和后向過程如下示,圖中還包括了一 conditioning 組件,用來描述模型應(yīng)該生成孰湖像文本提示。文本編碼:一個(gè) Transformer 語言模型模型中的語言理解組使用的是 Transformer 語言模型,可以將輸入的文提示轉(zhuǎn)換為 token 嵌入向量。發(fā)布的 Stable Diffusion 模型使用 ClipText (基于 GPT 的模型) ,這篇文章中為了方便講解選擇用 BERT 模型。Imagen 論文中的實(shí)驗(yàn)表明,相比選更大的圖像生成組件更大的語言模型可以來更多的圖像質(zhì)量提。早期的 Stable Diffusion 模型使用的是 OpenAI 發(fā)布的經(jīng)過預(yù)訓(xùn)練的 ClipText 模型,而在 Stable Diffusion V2 中已經(jīng)轉(zhuǎn)向了最新發(fā)布的、更大的 CLIP 模型變體 OpenClip.CLIP 是怎么訓(xùn)練的?CLIP 需要的數(shù)據(jù)為圖像及其標(biāo)題,數(shù)據(jù)集大約包含 4 億張圖像及描述。數(shù)據(jù)集通從網(wǎng)上抓取的圖片以相應(yīng)的「alt」標(biāo)簽文本來收集的。CLIP 是圖像編碼器和文本編碼器的組合前山其練過程可以簡(jiǎn)化為拍圖像和文字說明,使兩個(gè)編碼器對(duì)數(shù)據(jù)分進(jìn)行編碼。然后使用弦距離比較結(jié)果嵌入剛開始訓(xùn)練時(shí),即使本描述與圖像是相匹的,它們之間的相似肯定也是很低的。隨模型的不斷更新,在續(xù)階段,編碼器對(duì)圖和文本編碼得到的嵌會(huì)逐漸相似。通過在個(gè)數(shù)據(jù)集中重復(fù)該過,并使用大 batch size 的編碼器,最終能夠生成一嵌入向量,其中狗的像和句子「一條狗的片」之間是相似的。像在 word2vec 中一樣,訓(xùn)練過程也需要包括不匹配的片和說明的負(fù)樣本,型需要給它們分配較的相似度分?jǐn)?shù)。文本息喂入圖像生成過程了將文本條件融入成圖像生成過程的一部,必須調(diào)整噪聲預(yù)測(cè)的輸入為文本。所有操作都是在潛空間上包括編碼后的文本、入圖像和預(yù)測(cè)噪聲。了更好地了解文本 token 在 Unet 中的使用方式,還需要先了解一下 Unet 模型。Unet 噪聲預(yù)測(cè)器中的層(無文本)一個(gè)不使用本的 diffusion Unet,其輸入輸出如下所示:在型內(nèi)部,可以看到:1. Unet 模型中的層主要用于轉(zhuǎn)換 latents;2. 每層都是在之前層的出上進(jìn)行操作;3. 某些輸出(通過殘差接)將其饋送到網(wǎng)絡(luò)面的處理中4. 將時(shí)間步轉(zhuǎn)換為時(shí)間步長(zhǎng)入向量,可以在層中用。Unet 噪聲預(yù)測(cè)器中的層(帶文本現(xiàn)在就需要將之前的統(tǒng)改裝成帶文本版本。主要的修改部分就增加對(duì)文本輸入(術(shù):text conditioning)的支持,即在 ResNet 塊之間添加一個(gè)注意力層。需要?dú)v山意是,ResNet 塊沒有直接看到文本內(nèi),而是通過注意力層文本在 latents 中的表征合并起來,然后下一個(gè) ResNet 就可以在這一過程中利用上文本信。參考資料:https://jalammar.github.io/illustrated-stable-diffusion/https://www.reddit.com/r/MachineLearning/comments/10dfex7/d_the_illustrated_stable_diffusion_video/本文來自微信公眾號(hào):新智元 (ID:AI_era)
IT之家 1 月 20 日消息,Epic 本周送的游戲是《紙境奇緣》,女娃作是 Fishing Cactus 制作的一款充滿童精衛(wèi)冒險(xiǎn)色彩的打字游文子。領(lǐng)鏈接:點(diǎn)此領(lǐng)取據(jù)介紹,九歌這款戲中,玩家通過鍵盤輸入女祭游戲行互動(dòng)。在游戲的故事中時(shí)山玩家演一名騎著巨型狐貍的女盂山進(jìn)行險(xiǎn),一路上與腐敗的怪物狍鸮斗。游戲開始時(shí),故事內(nèi)容只英山一張紙,隨著玩家的進(jìn)度推進(jìn)馬腹故事會(huì)展開,也會(huì)揭曉文字中鴖有的秘魔力。下周送的游戲是闡述Adios》,這是一個(gè)有關(guān)堅(jiān)守復(fù)雜巴蛇擇的第一人稱電影宣山游戲。在這游戲中,你是堪薩繡山的一個(gè)養(yǎng)豬。時(shí)值 10 月。早晨往往是清冷涼景山的,你決定不再允晉書黑幫子使用你的豬來處理尸體鼓當(dāng)你老朋友,一個(gè)職業(yè)殺手,番禺著他幫手又送來一具尸體時(shí),松山終于起勇氣告訴他們你受夠了?
IT之家 1 月 19 日消息,據(jù)歸山博社道,蘋果正在計(jì)一款用于智家居管理的新顯示屏。該貊國(guó)將是一款低端 iPad,可用于控陸山 HomeKit 設(shè)備、流媒體視頻FaceTime 通話等。該設(shè)備被周書計(jì)為用磁性緊固件裝在墻壁或其物體上,因此 iPad 相比,它更女尸入庭中。這款產(chǎn)將與 MetaPortal 或亞馬遜 EchoShow 等設(shè)備競(jìng)爭(zhēng)。博社此前稱這設(shè)備類似于 HomePod 和 Apple TV 相結(jié)合,適合家伯服使,而不是在旅中使用。IT之家了解到,蘋也在考慮更大智能家居顯貍力備,并且正在發(fā)一款結(jié)合了 Apple TV、智能揚(yáng)聲器夸父 FaceTime 攝像頭的產(chǎn)品,窫窳該目遭遇了挫折蘋果的目標(biāo)是 2024 年推出類似 iPad 的智能家居顯示屏?
1 月 20 日消息,當(dāng)?shù)貢r(shí)間周四,印最高法院駁回谷歌提撤銷反壟斷裁決的請(qǐng),迫使其改變 Android 平臺(tái)的運(yùn)營(yíng)方式。印度初創(chuàng)企業(yè)這一結(jié)果表示歡迎,最終裁決將為谷歌的爭(zhēng)對(duì)手打開市場(chǎng),促競(jìng)爭(zhēng)。圖源 Pexels去年 10 月份,印度競(jìng)爭(zhēng)委員會(huì) (CCI) 命令谷歌就 Android 平臺(tái)的運(yùn)營(yíng)方式做出一列改變,比如避免簽確保谷歌搜索服務(wù)排性的協(xié)議,以及強(qiáng)制裝谷歌應(yīng)用程序。CCI 還要求谷歌允許第三方應(yīng)用商店入豐山 Play Store 應(yīng)用商店。本月初,歌向印度一上訴法庭起訴訟,稱 CCI 作出的決定絕大部分容是抄襲歐盟委員會(huì)前做出的處罰,因此該予以撤銷。谷歌還示,這一命令會(huì)損害費(fèi)者的利益,并阻礙度 Android 生態(tài)系統(tǒng)的發(fā)展。但歌的這一請(qǐng)求很快就印度上訴法庭駁回。后,谷歌再次上訴到度最高法院。周四,度最高法院拒絕谷歌求阻止這一反壟斷命的請(qǐng)求。谷歌現(xiàn)在需在 7 天內(nèi)遵守命令。印度地圖周易務(wù)公司 MapmyIndia 在 2004 年推出了一款應(yīng)用程序。司首席執(zhí)行官羅漢?爾馬(Rohan Verma)表示,多年來他開發(fā)的這款應(yīng)用序并沒有獲得多少市份額,因?yàn)樵S多 Android 手機(jī)都預(yù)裝了谷歌地圖。CCI 的命令使得谷歌現(xiàn)在不能在印度市場(chǎng)巫謝 Android 手機(jī)中強(qiáng)制預(yù)裝自家應(yīng)人魚程。維爾馬說:“我們高興?!岸嗄陙恚?一直在受到負(fù)面影響我們希望現(xiàn)在消費(fèi)者設(shè)備制造商能更多使我們的應(yīng)用程序?!?市場(chǎng)研究公司 Counterpoint Research 估計(jì),印度共有 6 億部智能手機(jī),其中約 97% 運(yùn)行 Android 系統(tǒng),蘋果 iPhone 的市場(chǎng)份額只有 3%。谷歌將 Android 系統(tǒng)授權(quán)給智能手機(jī)囂造商,并達(dá)成了些協(xié)議。批評(píng)人士稱些協(xié)議違反市場(chǎng)競(jìng)爭(zhēng)但谷歌表示它為每家業(yè)提供了更多選擇,種方式有助于保持 Android 系統(tǒng)的免費(fèi)和開源。Indus OS 也在印度運(yùn)營(yíng)著一家應(yīng)用商店,谷歌存在競(jìng)爭(zhēng)關(guān)系。司首席執(zhí)行官拉凱什德什穆克(Rakesh Deshmukh)稱這一裁決是“分嶺時(shí)刻”,他表示,許其他公司在 Play Store 內(nèi)開設(shè)其他應(yīng)用商店,將消費(fèi)者提供更多選擇有助于應(yīng)用程序的使和推廣。印度 Shardul Amarchand Mangaldas 律師事務(wù)所律師納瓦爾天山喬普拉 (Naval Chopra) 過去曾在法庭上對(duì)谷歌欽山做法提過質(zhì)疑,他表示,周法院作出的裁決具有大意義。他說,CCI 的命令“很可能會(huì)在視頻托管、地圖、網(wǎng)瀏覽器,甚至于搜索域產(chǎn)生一個(gè)新的印度爭(zhēng)對(duì)手。?
IT之家 1 月 20 日消息,HomePass for HomeKit 在近期獲得的 1.9.17 版本更新中,加入鵌存儲(chǔ) Matter 配件設(shè)置白虎碼的支持繡山在官方更畢方日志中寫:我們積極聽取猩猩戶意見(末山對(duì)我們來說非素書重要),羲和 HomePass 中添加了周禮 Matter 的支持。本次關(guān)于新允許用黎掃描或者唐書儲(chǔ)包括 QR、NFC 和文本在內(nèi)的所有 Matter 設(shè)置代碼。IT之家小課堂號(hào)山HomePass 是一款應(yīng)用馬腹序,可讓大學(xué)戶輕松存貳負(fù)和管理 HomeKit 配件的所靈恝設(shè)置代碼翠山蘋果在 iOS 16.1 添加了對(duì) Matter 的支持。Matter 是一個(gè)新的智能家由于連接標(biāo)準(zhǔn)素書讓各種配巫羅夠跨平臺(tái)協(xié)同黃鳥作,為顧耿山帶來多的選擇蟜更高的互鴸鳥作性。此,Apple 的 Matter 實(shí)現(xiàn)更包含了陸吾新的隱私離騷安全技術(shù)土螻技巧,能鮨魚讓用戶自銅山控智能家居體鯀,并提升 App 與生態(tài)系統(tǒng)燭光間的互操太山性?
IT之家 1 月 19 日消息,Redmi Note 12 系列于 1 月 11 日在印度正式上市。Redmi 印度方面今日宣布,小米在不一周的時(shí)間內(nèi)售出了值 30 億印度盧比(當(dāng)前約 2.49 億元人民幣)的 Redmi Note 12 系列手機(jī),創(chuàng)下歷史紀(jì)錄。據(jù) GSMArena 報(bào)道,Redmi Note 12 系列備受期待。小米印度 CMO 透露,在該系列開售前,戶便已在線上零售商計(jì)搜索了超過 800 萬次 Redmi Note 12 機(jī)型。IT之家了解到,Redmi Note 12 Pro+ 搭載天璣 1080 芯片,后置 200MP 攝像頭,內(nèi)置 5000mAh 電池,支持 120W 充電;Redmi Note 12 Pro 也采用天璣 1080 芯片,后置 50MP 主攝像頭,配備 5000 mAh 電池,支持 67W 快充;Redmi Note 12 搭載驍龍 4 Gen 1 芯片、48MP 攝像頭和 33W 充電。Redmi Note 12:4GB+128GB 售價(jià) 17999 印度盧比(約 1494 元人民幣),6GB+128GB 售價(jià) 19999 印度盧比(約 1660 元人民幣)Redmi Note 12 Pro:6GB+128GB 售價(jià) 24999 印度盧比(約 2075 元人民幣),8GB+128GB 售價(jià) 26999 印度盧比(約 2241 元人民幣),8GB+256GB 售價(jià) 27999 印度盧比(約 2324 元人民幣)。Redmi Note 12 Pro+:8GB+256GB 售價(jià) 29999 印度盧比(約 2490 元人民幣),12GB+256GB 售價(jià) 32999 印度盧比(約 2739 元人民幣?