과정상세

1Day LMM(Large Multimodal Model, 멀티모달) 이해하기

집합

교재제공 초급

1Day LMM(Large Multimodal Model, 멀티모달) 이해하기

4.7

like 16

400,000원 (VAT없음)

학습기간

개폐강 확정일 2025.05.18

과정요약

과정요약
학습시간	09:30 ~ 17:30 ( 7시간 )	난이도	초급
교육비 지원	고용보험 비환급	평가항목	출석률 100%
수료기준	총점 80점 이상시 수료	정원	32 명
교재정보	[PDF] 1Day LMM(Large Multimodal Model, 멀티모달) 이해하기

과정소개

최신 AI 모델은 정보를 활용하는데 그치지 않고, 시각 정보를 활용하는 우리 일상생활에서 필요로 하는 작업을 할 수 있습니다.
최근에는 생성형 모델이 다양하게 소개되어, 이미지를 설명하거나 원하는대로 생성할 수 가 있습니다.
기존 대부분의 교육과정들은 언어적 정보만을 활용하는 것에 촛점이 맞춰져 있어
언어와 시각정보를 함께 활용할 수 있도록 하루만에 배울 수 있습니다.

Multimodal AI Large Multimodal Model언어정보+시각정보 생성AI LLM

1Day LMM(Large Multimodal Model) 이해하기

텍스트와 이미지 동시 활용가능한 멀티모달 AI에 대한 이해!

AI는 언어만 다루는게 아니라 이미지도 다룹니다.
언어정보와 시각정보까지 함께 다루는 최신 멀티모달 AI 모델이 어떻게 동작하는지,
학습방법에는 무엇이 있는지 이해할 수 있습니다.

이미지를 설명하고, 생성하고, 수정까지!

이미지를 설명하는 문장을 만들고 이미지를 원하는대로 생성하고
채팅으로 수정하는 것 까지 확인해 볼 수 있습니다.

공개서비스 및 공개모델의 로컬셋팅

공개 서비스를 사용하고 원한다면 자신의 컴퓨터에 모델을 간단히 셋팅하여
제약없이 원하는대로 만들어볼 수 있습니다.

※ 아래 항목 중 3개이상 보유 시 본 과정의 목표를 효과적으로 달성할 수 있습니다.

□ 파이썬을 사용해 보았거나 파이썬 기본문법/함수에 대해 잘 알고 있다.
□ 멀티모달 태스크가 무엇이 있는지와 태스크 각각에 대해 설명할 수 있다.
□ 최신 LLM 모델(LLaMa, GPT-4, Vicuna) 등에 대해 간략히 알고 있다.
□ ChatGPT 외 최신 AI 공개 서비스를 이용해본 경험이 있다.
□ Github에 공개된 코드를 사용해본 경험이 있다.

* 본 과정은 최신 트렌드 관련하여 업데이트가 빠른 관계로 일자별 표기된 강의내용과 배정시간이 매 차수별로 다소 변경될 수 있음을 알려드립니다.

멀티캠퍼스 🏆Best🏆 과정
LLM 파인튜닝 마스터, 생성형 AI 기초부터 PEFT까지 그 강사!!!

🌈 변형호 강사님을 소개합니다!

🎓 학력
- 서울대학교 컴퓨터공학부 박사
- 한국과학기술원(KAIST) 전산학부 학사

💻 경력
- 現) 삼성SDS LLM 프로그래밍 강의
- 現) 국가보안기술연구소 기술 자문
- 前) SK Telecom, 신한투자증권, HL그룹, GS그룹, 한국앤컴퍼니 생성AI/LLM 강의

학습목표

다양한 형태의 멀티모달 데이터를 처리하는 생성 AI 기술의 기본 원리를 이해할 수 있습니다.
멀티모달 AI의 발전 과정과 주요 모델들의 특성을 이해할 수 있습니다.
멀티모달 학습 방법론과 데이터셋 구성 방법을 이해하고, 활용 방법에 대한 지식을 습득할 수 있습니다.
최신 멀티모달 모델들의 구조를 이해하고, 멀티모달 모델의 흐름에 대해 이해할 수 있습니다.
실제 모델 데모를 통해 멀티모달 AI의 적용 가능성과 발전 방향을 체득할 수 있습니다.

학습대상

생성 AI에 관심이 있는 연구자 및 개발자
멀티모달 데이터를 활용하는 프로젝트에 참여하는 IT 전문가
멀티모달 AI 기술의 기본 원리와 응용 방법을 이해하고자 하는 개발자 및 연구자
최신 AI 기술 동향에 관심 있는 기술 관리자 및 의사결정자

- 1일차
  - 생성형AI와 멀티모달 기술의 이해
    - 모달리티(Modality)별 생성 AI의 원리, 멀티모달 AI의 활용 예시 09:30 ~ 10:30
  - 멀티모달 학습 방법론
    - 멀티모달 AI 구성 요소 및 인코더-디코더 구조 소개
      LLM 모델과 멀티모달 AI의 관계
      멀티모달 AI의 학습 과정: Instruction Tuning 10:30 ~ 11:30
    - 멀티모달 AI의 발전 과정, 기본 멀티모달 모델 소개(CLIP, CoOp, BLIP) 11:30 ~ 12:30
  - 텍스트-이미지 모델
    - 이미지 생성 모델의 발전 과정
      GAN, Stable Diffusion, Dall-E의 작동 원리 13:30 ~ 14:30
    - Vision-Language Representation, Text2image Inference 기술
      OpenFlamingo, Llava 모델 소개 14:30 ~ 15:30
  - 최신 멀티모달 기술 소개
    - 고성능 멀티모달 AI 기술(GPT-4-Vision, Gemini 등)
      멀티모달 AI의 향후 과제 15:30 ~ 16:30
  - 공개 모델 데모
    - 공개 모델(WebUI, VisualGPT, MiniGPT-4 등) 설정 및 데모 16:30 ~ 17:30

수강후기 16

평균평점

4.7 / 5.0

5

송*우
2024.12.09

효율적인 예제와 실시간 데이터로 학습에 많은 도움이 되었습니다
5

최*나
2024.12.09

LLM 흐름을 이해하는데 도움
4

조*래
2024.12.09

설명, 실습이 좋았음
5

최*영
2024.12.09

이론과 실습이 모두 포함되어 있어서 좋았습니다.
5

주*호
2024.12.09

강사님 훌륭하시고 좋은 내용입니다

학습기간

개폐강 확정일 2025.05.18