ATL-Diff: Audio-Driven Talking Head Generation using Early Landmark Guide Noise Diffusion.
Audio-driven talking head generation presents significant challenges in creating realistic facial animations that accurately synchronize with audio signals. This paper introduces ATL-Diff, a novel approach that addresses key limitations in existing methods through an innovative three-component framework.
Image Super-Resolution -Tăng cường độ phân giải hình ảnh với AI
Image Super Resolution (ISR) và mình sẽ giới thiệu một ứng dụng demo mà mình đã làm, cách bạn tham khảo và sử dụng vào các đồ án môn học. Đặc biệt, đồ án này dành riêng cho các sinh viên ngành AI, giúp các bạn tiếp cận với những công nghệ tiên tiến một cách trực quan và dễ hiểu.
Diffusion model là gì?
Diffusion model là một mô hình tạo sinh với những đột phá trong việc sinh hình ảnh. Là một bước tiến trong ngành Trí tuệ nhân tạo và là nền tảng của các ứng dụng sinh ảnh hiện nay như Stable Diffusion, Dall-E, Midjourney
Prompt Engineering for GPT #1: Prompt Engineering là gì?
Prompt engineering là một phương pháp đem lại sự hiệu quả tốt nhất khi giao tiếp với các mô hình ngôn ngữ lớn (LLMs).
3D-DDA: 3D Dual-Domain Attention for Brain Tumor Segmentation
3D Dual-Domain Attention for Brain Tumor Segmentaion is a method which develope based on Attention mechanims with key idea is using a path-of-net to extract information about global of context, other one learning information about local of context.
Khóa luận tốt nghiệp: Phân đoạn ung thư não sử dụng các phương pháp học sâu
My graduate thesis in HUFLIT: Brain Tumor Detection using Deep Learning
3D Slicer: An Extension for Brain Tumor Segmentaion.
This is my demo app for my graduate thesis of topic: “Brain Tumor Detection by Deep Learning”
3D Dual-Fusion Attention Network for Brain Tumor Segmentation
3D Brain Tumor Segmentaion using method 3D-Dual Fusion Attention base on Fusion method, Attention mechanism, and Residual learning.