제1강 : 생성형 AI의 기초

생성형AI의 개념과 최근 트렌드

주요 주제
생성형 AI의 이해
  • • 머신러닝과 딥러닝의 발전 과정
  • • 추론 모델, 비추론 모델의 차이와 딥리서치
  • • MCP 모델의 이해
AI 서비스 현황
  • • 주요 AI 서비스 비교
  • • 분야별 AI 활용 사례
  • • AI 서비스 선택 시 고려사항

강의 내용

🟣 우리는 어떤 시대를 살고 있나
기억의 시대

지식과 정보의 관점의 생산과 유통이라는 측면에서 본다면, 인류의 역사에서 대부분의 시간은 인간의 기억은 권력과 권위의 원천이었습니다. 책으로 기록된 정보는 그 책을 읽거나, 가지거나, 기억하는 사람이 힘이 있었습니다.

검색의 시대

이런 판도는 인터넷이 나오면서 크게 바뀌었습니다. 인터넷을 통해서 우리가 원하는 정보를 찾아볼 수 있었습니다. 굳이 모든걸 외우기보다는 어떤 정보가 어디에 있는지를 알고, 잘 찾는게 중요한 시대였습니다.

질문의 시대

생성형 AI가 대세가 된 시대는 어떨까요? 바야흐로 "잘 질문하는게 중요한 시대"가 됐습니다. 생성형 AI는 우리가 입력한 지시(프롬프트)에 따라 결과물을 만들어냅니다. 예를 들어 "고양이 그림을 그려줘"라고 요청하면 AI는 고양이 이미지를 생성하고, "여행 계획을 짜줘"라고 하면 여행 일정표를 작성해 줍니다.

Pre-digital eraMemory-based learning and authorityDigital ageRise of search engines and information literacyFutureInteractive and creative inquiry-driven learningEvolution of Information Access: From Memory to Inquiry
🟣 생성형 AI란 무엇인가?

생성형 AI는 새로운 콘텐츠를 만들어내는 인공지능 기술입니다. 글, 이미지, 음악, 영상 등 다양한 형태의 창작물을 AI가 스스로 생성할 수 있습니다. ChatGPT, 미드저니, 클로바 등이 대표적인 생성형 AI 서비스입니다.

생성형 AI는 우리가 입력한 지시(프롬프트)에 따라 결과물을 만들어냅니다. 예를 들어 "고양이 그림을 그려줘"라고 요청하면 AI는 고양이 이미지를 생성하고, "여행 계획을 짜줘"라고 하면 여행 일정표를 작성해 줍니다.

🟣 AI의 발전 과정

인공지능은 컴퓨터가 사람처럼 생각하고 학습하는 기술입니다. 초기에는 간단한 규칙을 프로그래밍하는 방식이었지만, 점차 컴퓨터가 데이터로부터 스스로 학습하는 '머신러닝'으로 발전했습니다.

최근에는 사람의 뇌를 모방한 '딥러닝' 기술이 크게 발전하면서 AI의 능력이 비약적으로 향상되었습니다. 특히 2022년 이후 ChatGPT와 같은 대규모 언어 모델의 등장으로 누구나 쉽게 AI를 활용할 수 있는 시대가 열렸습니다.

🟣 딥러닝과 머신러닝

머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하고, 그 결과를 바탕으로 예측을 수행하는 기술입니다. 쉽게 말해, 데이터를 입력하면 컴퓨터가 스스로 그 패턴을 학습하고, 새로운 상황에서도 비슷한 결과를 예측할 수 있게 되는 것입니다.

딥러닝은 머신러닝의 한 분야로, 사람의 뇌를 본떠 만든 인공신경망을 이용해 데이터를 학습하는 방법입니다. 여러 층으로 이루어진 신경망을 사용해 복잡한 문제를 해결하며, 특히 이미지 인식, 음성 인식, 자연어 처리에 매우 효과적입니다.

추론 모델과 비추론 모델

🧠 추론 모델 (Reasoning Models)은 입력 정보를 바탕으로 논리적 사고 과정을 거쳐 결론을 도출하는 AI 모델입니다. 복잡한 문제 해결, 수학적 증명, 코드 작성 등에서 뛰어난 성능을 보이며, 단계적 사고(chain-of-thought)를 통해 문제를 분해하고 해결책을 찾아냅니다.

대표적인 추론 모델:

  • OpenAI o1 Pro: OpenAI의 고급 추론 모델로, 20만 토큰의 컨텍스트 창을 지원하며, 복잡한 수학 및 과학 문제 해결에 특화되어 있습니다.
  • DeepMind Gemini 2.5 Pro: Google DeepMind의 최신 모델로, 다단계 추론이 요구되는 복잡한 작업 수행에 탁월한 성능을 보입니다. 100만 토큰의 컨텍스트 창을 지원하며, 멀티모달 입력을 처리할 수 있습니다.

💬 비추론 모델 (Non-reasoning Models)은 통계적 패턴 인식에 기반하여 작동하는 모델로, 대규모 데이터셋에서 학습한 패턴을 바탕으로 응답을 생성합니다. 일반적인 대화, 콘텐츠 요약, 창의적 작문 등에서 효율적이지만, 복잡한 논리 과정이 필요한 작업에는 한계가 있습니다.

대표적인 비추론 모델:

  • GPT-4o: OpenAI의 멀티모달 모델로, 텍스트, 이미지, 음성 등 다양한 입력을 처리할 수 있습니다. 빠른 응답성과 자연스러운 언어 생성에 강점을 보입니다.
  • Gemini 2.0 Flash: Google DeepMind의 모델로, 빠른 응답 속도와 멀티모달 입력 처리를 지원하며, 다양한 언어 생성 작업에 사용됩니다.

🔀 하이브리드 모델 (Hybrid Models)은 추론 기반 접근법과 비추론 기반 접근법을 결합한 모델입니다. 일반적인 언어 이해 능력과 복잡한 추론 능력을 동시에 갖추어 다양한 작업에서 균형 잡힌 성능을 제공합니다.

대표적인 하이브리드 모델:

  • Claude 4.0 Sonnet: Anthropic의 최신 모델로, 빠른 응답과 복잡한 추론을 모두 수행할 수 있는 하이브리드 모델입니다. 사용자는 응답 속도와 사고 깊이를 조절할 수 있으며, 복잡한 코드 작성 및 데이터 분석에 탁월한 성능을 보입니다.
구분 추론 모델 비추론 모델 하이브리드 모델
주요 활용 분야 복잡한 문제 해결, 프로그래밍, 수학적 증명, 논리 퍼즐 일반 대화, 콘텐츠 생성, 텍스트 요약, 감정 분석 범용 AI 비서, 연구 지원, 교육용 도구, 기술 문서 작성
장점 정확한 사고 과정 제시, 복잡한 문제 해결 능력 빠른 응답 속도, 자연스러운 대화, 리소스 효율성 다양한 작업에 적응 가능, 균형 잡힌 성능
단점 컴퓨팅 자원 소모 큼, 느린 응답 속도 복잡한 문제 해결 어려움, 논리적 오류 발생 특정 영역에서 전문 모델보다 성능 부족
비용 효율성 낮음 (고비용) 높음 (저비용) 중간
Model Context Protocol (MCP) 소개

Model Context Protocol (MCP)는 Anthropic이 2024년 11월 25일에 발표한 오픈 표준으로, 대형 언어 모델(LLM)과 외부 데이터 소스 및 도구 간의 통합을 표준화하여 AI 시스템이 다양한 컨텍스트를 실시간으로 활용할 수 있도록 합니다.
"쉽게 말하면, AI가 더 똑똑하게 일할 수 있도록 돕는 새로운 기술로서 AI가 다양한 자료를 찾아보고 필요한 도구를 직접 사용할 수 있게 만들어주는 표준 규칙입니다."

📌 MCP가 하는 일
  • 자료를 연결해줍니다: 인터넷이나 회사 내부 자료를 AI가 쉽게 찾아볼 수 있게 해줍니다.
  • 도구를 사용하게 합니다: 계산기나 검색기처럼 AI가 필요한 도구를 직접 사용할 수 있게 해줍니다.
  • 모든 AI에 사용 가능합니다: 특별한 AI 하나에만 필요한 게 아니라, 여러 AI가 함께 쓸 수 있게 만들었습니다.
🔧 MCP 안에는 무엇이 있을까요?
  • 호스트(Host): 사람 대신 AI가 활동하는 곳입니다.
  • 클라이언트(Client): 호스트와 연결해주는 다리 역할을 합니다.
  • 서버(Server): 자료나 도구를 실제로 보관하고 있는 곳입니다.
🧩 MCP로 할 수 있는 것
  • 자료(Resource) 사용하기: AI가 필요한 문서나 데이터를 쉽게 찾아볼 수 있습니다.
  • 도구(Tool) 사용하기: 복잡한 계산이나 특정 작업을 직접 처리할 수 있습니다.
  • 프롬프트(Prompt) 사용하기: 필요한 질문이나 명령어를 더 쉽게 만들 수 있습니다.
🚀 MCP가 있으면 좋은 점
  • 코딩: 프로그램 코드를 더 빠르고 똑똑하게 작성할 수 있습니다.
  • AI 비서: 회사 문서나 고객 정보를 빠르게 찾아 대답할 수 있습니다.
  • 데이터 분석: 복잡한 데이터도 쉽게 물어보고 답을 얻을 수 있습니다.
🔒 보안 및 신뢰성

MCP는 강력한 기능을 제공하는 만큼, 보안과 신뢰성 확보가 중요합니다. 인증, 권한 관리, 데이터 무결성 검증 등의 메커니즘을 통해 안전한 통신을 보장합니다.

📚 추가 자료
주요 생성형 AI 모델 현황(2025년 4월)
모델버전 주요 특징 출시일 비고
GPT-4o 텍스트, 이미지, 오디오, 비디오 처리 2024-05 멀티모달 모델로 성능 향상
o1 고급 추론 및 문제 해결 능력 2024-12 복잡한 과학, 코딩, 수학 문제 해결에 최적화
o3 향상된 추론 모델 2025-01 o1의 후속 모델로 성능 개선
GPT-4.5 감성 지능 및 자연스러운 대화 능력 강화 2025-02 환각 현상 감소 및 창의적 통찰력 향상. 높은 비용으로 서비스 중단 예정
GPT-4.1 향상된 코딩 및 지시 따르기 능력, 긴 문맥 처리 지원 2025-04 GPT-4o 대비 성능 및 비용 효율성 향상. 100만 토큰 처리 가능. API로만 사용가능
Claude 4.0 Sonnet 하이브리드 추론 모델, 빠른 응답 및 확장 사고 모드 지원 2025-05 뛰어난 코딩 성능, 복잡한 추론과 자연어 처리 최적화. 최대 128K 토큰 출력 지원
Gemini 2.5 Pro 향상된 추론 및 코딩 성능, 멀티모달 입력 지원 2025-03 100만 토큰 문맥 창 지원, 텍스트·이미지·오디오·비디오 입력 처리 가능
생성형 AI의 핵심 개념
개념 정의 실생활 비유 중요도
모델 구조 관련 개념
파라미터 AI 모델이 학습하고 저장하는 수치들의 집합으로, 모델의 지식과 능력을 결정짓는 핵심 요소. 사람의 뇌 시냅스처럼, 더 많은 연결이 더 복잡한 사고를 가능하게 함 핵심
멀티모달 텍스트, 이미지, 음성 등 여러 형태의 입력을 동시에 처리할 수 있는 AI 모델의 능력입니다. GPT-4o가 대표적. 사람이 보고, 듣고, 읽으면서 동시에 정보를 처리하는 것처럼 핵심
임베딩 텍스트나 이미지를 AI가 이해할 수 있는 고차원의 숫자 벡터로 변환하는 과정입니다. 도서관의 책 분류 체계, 비슷한 주제는 가까운 위치에 배치 중요
텍스트 처리 관련 개념
토큰 AI가 처리하는 텍스트의 최소 단위로, 단어나 부분 단어를 토큰으로 분리하여 처리합니다. 단어를 구성하는 자음과 모음, 또는 문장을 구성하는 단어들 핵심
컨텍스트 윈도우 AI가 한 번에 처리하고 기억할 수 있는 텍스트의 최대 길이입니다. 한 번에 읽고 이해할 수 있는 토큰의 양 중요
생성 제어 관련 개념
프롬프트 엔지니어링 AI에게 더 정확하고 원하는 결과를 얻기 위해 입력값을 체계적으로 설계하는 기술입니다. 원하는 결과를 얻기 위해 질문을 정교하게 다듬는 과정 핵심
스키마(Schema) AI의 출력 형식을 미리 정의하여 일관된 구조의 응답을 받을 수 있게 하는 틀입니다. JSON, XML 등의 형식으로 지정할 수 있습니다. 요리 레시피처럼, 결과물의 형식과 구조를 미리 정해두는 것 핵심
Temperature AI 응답의 창의성과 무작위성을 조절하는 0~1 사이의 값입니다. 1에 가까울수록 창의적인 답변을 반환환 중요
주요 생성형 AI 서비스 현황
분야 서비스명 주요 특징 제공사
텍스트 생성 ChatGPT (GPT-4o) 멀티모달 지원, 실시간 대화형 AI OpenAI
Claude 4.0 Sonnet 고급 추론 및 확장 사고 모드 지원 Anthropic
Gemini 2.5 pro 멀티모달 처리, 구글 생태계 통합 Google DeepMind
이미지 생성 Imagen 3 고품질 이미지 생성, 빠른 처리 속도 Google
FLUX Pro 1.1 Ultra 스타일 제어 강화, 높은 사용자 만족도 BlackForestLabs
Midjourney V7 예술적 이미지 생성, 스타일 다양성 Midjourney
비디오 생성 Veo 3 고품질 비디오 생성, 빠른 렌더링 Google DeepMind
Runway AI 기반 영상 생성 및 편집, 실시간 협업 Runway
생산성 도구 Notion AI 문서 요약, 자동화된 콘텐츠 생성 Notion
Gamma 프레젠테이션 자동 생성, 디자인 지원 Gamma
생산성 도구 Napkin 아이디어 정리 및 시각화 도구 Napkin
검색 기능 Perplexity AI 실시간 검색 기반 응답, GPT-4 Turbo 및 Claude 3 통합 Perplexity AI
Liner 생성형 웹 검색, 개인화된 정보 제공 Liner
Felo AI 검색 및 자료 정리, 마인드맵 생성 Sparticle
Genspark 다중 모델 응답, 무료 사용 가능 Genspark