October 24th, 2023 - Neural Visions Unveiled: From FreeNoise's Video Clarity, HallusionBench's Reality Check, to FlashEdit's Instant Image Refinements
Manage episode 380721281 series 3485608
コンテンツは Marcus Edel によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Marcus Edel またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
- FreeNoise: Tuning-Free Longer Video Diffusion Via Noise Rescheduling
- HallusionBench: You See What You Think? Or You Think What You See? An Image-Context Reasoning Benchmark Challenging for GPT-4V(ision), LLaVA-1.5, and Other Multi-modality Models
- Localizing and Editing Knowledge in Text-to-Image Generative Models
章
1. Intro (00:00:00)
2. FreeNoise: Tuning-Free Longer Video Diffusion Via Noise Rescheduling (00:01:14)
3. HallusionBench: You See What You Think? Or You Think What You See? An Image-Context Reasoning Benchmark Challenging for GPT-4V(ision), LLaVA-1.5, and Other Multi-modality Models (00:03:17)
4. Localizing and Editing Knowledge in Text-to-Image Generative Models (00:05:16)
75 つのエピソード