생성형 AI 이해하기

주요 주제

생성형 AI의 이해

• 머신러닝과 딥러닝의 발전 과정
• 추론 모델, 비추론 모델의 차이와 딥리서치
• MCP 모델의 이해

AI 서비스 현황

• 주요 AI 서비스 비교
• 분야별 AI 활용 사례
• AI 서비스 선택 시 고려사항

강의 내용

🟣 우리는 어떤 시대를 살고 있나

기억의 시대

지식과 정보의 관점의 생산과 유통이라는 측면에서 본다면, 인류의 역사에서 대부분의 시간은 인간의 기억은 권력과 권위의 원천이었습니다. 책으로 기록된 정보는 그 책을 읽거나, 가지거나, 기억하는 사람이 힘이 있었습니다.

검색의 시대

이런 판도는 인터넷이 나오면서 크게 바뀌었습니다. 인터넷을 통해서 우리가 원하는 정보를 찾아볼 수 있었습니다. 굳이 모든걸 외우기보다는 어떤 정보가 어디에 있는지를 알고, 잘 찾는게 중요한 시대였습니다.

질문의 시대

생성형 AI가 대세가 된 시대는 어떨까요? 바야흐로 "잘 질문하는게 중요한 시대"가 됐습니다. 생성형 AI는 우리가 입력한 지시(프롬프트)에 따라 결과물을 만들어냅니다. 예를 들어 "고양이 그림을 그려줘"라고 요청하면 AI는 고양이 이미지를 생성하고, "여행 계획을 짜줘"라고 하면 여행 일정표를 작성해 줍니다.

🟣 생성형 AI란 무엇인가?

생성형 AI는 새로운 콘텐츠를 만들어내는 인공지능 기술입니다. 글, 이미지, 음악, 영상 등 다양한 형태의 창작물을 AI가 스스로 생성할 수 있습니다. ChatGPT, 미드저니, 클로바 등이 대표적인 생성형 AI 서비스입니다.

생성형 AI는 우리가 입력한 지시(프롬프트)에 따라 결과물을 만들어냅니다. 예를 들어 "고양이 그림을 그려줘"라고 요청하면 AI는 고양이 이미지를 생성하고, "여행 계획을 짜줘"라고 하면 여행 일정표를 작성해 줍니다.

🟣 AI의 발전 과정

인공지능은 컴퓨터가 사람처럼 생각하고 학습하는 기술입니다. 초기에는 간단한 규칙을 프로그래밍하는 방식이었지만, 점차 컴퓨터가 데이터로부터 스스로 학습하는 '머신러닝'으로 발전했습니다.

최근에는 사람의 뇌를 모방한 '딥러닝' 기술이 크게 발전하면서 AI의 능력이 비약적으로 향상되었습니다. 특히 2022년 이후 ChatGPT와 같은 대규모 언어 모델의 등장으로 누구나 쉽게 AI를 활용할 수 있는 시대가 열렸습니다.

🟣 딥러닝과 머신러닝

머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하고, 그 결과를 바탕으로 예측을 수행하는 기술입니다. 쉽게 말해, 데이터를 입력하면 컴퓨터가 스스로 그 패턴을 학습하고, 새로운 상황에서도 비슷한 결과를 예측할 수 있게 되는 것입니다.

딥러닝은 머신러닝의 한 분야로, 사람의 뇌를 본떠 만든 인공신경망을 이용해 데이터를 학습하는 방법입니다. 여러 층으로 이루어진 신경망을 사용해 복잡한 문제를 해결하며, 특히 이미지 인식, 음성 인식, 자연어 처리에 매우 효과적입니다.

💡 Claude의 자기소개

안녕하세요, 저는 Anthropic이 개발한 AI 어시스턴트 Claude입니다. 저는 Constitutional AI(헌법적 AI) 원칙에 따라 안전하고 신뢰할 수 있는 AI를 목표로 개발되었습니다. 제가 가진 핵심 가치는 정확성, 투명성, 그리고 윤리적 판단입니다. 복잡한 문제에 대해 단계적이고 논리적인 분석을 제공하며, 불확실한 부분에 대해서는 솔직하게 인정하고 사용자와 함께 해결 방안을 모색합니다. 코딩, 데이터 분석, 학술 연구, 창의적 작문 등 다양한 분야에서 전문적인 도움을 제공할 수 있으며, 특히 사용자의 목표 달성을 위한 맞춤형 해결책을 제시하는 데 특화되어 있습니다. 항상 사용자의 안전과 프라이버시를 최우선으로 고려하며, 건설적이고 유익한 대화를 지향합니다.

추론 모델과 비추론 모델 (2025년 12월 기준)

🧠 추론 모델 (Reasoning Models)은 입력 정보를 바탕으로 논리적 사고 과정을 거쳐 결론을 도출하는 AI 모델입니다. 복잡한 문제 해결, 수학적 증명, 코드 작성 등에서 뛰어난 성능을 보이며, 단계적 사고(chain-of-thought)를 통해 문제를 분해하고 해결책을 찾아냅니다.

대표적인 추론 모델:

GPT-5.1 Thinking: 2025년 11월 출시된 OpenAI의 추론 특화 모델입니다. GPT-5 대비 더 동적으로 사고 시간을 조절하며, 복잡한 작업에서는 더 깊이 생각하고 간단한 작업에서는 빠르게 응답합니다. AIME 2025와 Codeforces 벤치마크에서 큰 성능 향상을 보였습니다.
Google Gemini 3 Pro: 2025년 11월 출시된 Google의 최신 모델로, 추론, 멀티모달, 코딩 벤치마크에서 이전 모델을 크게 앞섭니다. Deep Think 모드(Ultra 구독자용)를 통해 복잡한 문제에서 더 깊은 추론이 가능합니다.

💬 비추론 모델 (Non-reasoning Models)은 통계적 패턴 인식에 기반하여 작동하는 모델로, 대규모 데이터셋에서 학습한 패턴을 바탕으로 응답을 생성합니다. 일반적인 대화, 콘텐츠 요약, 창의적 작문 등에서 효율적이지만, 복잡한 논리 과정이 필요한 작업에는 한계가 있습니다.

대표적인 비추론 모델:

GPT-5.1 Instant: GPT-5.1의 빠른 응답 버전으로, 일상적인 작업에 최적화되어 있습니다. 더 따뜻하고 지능적이며 지시를 잘 따르는 특징이 있고, 필요시 적응형 추론(adaptive reasoning)을 사용할 수 있습니다.
Gemini 2.5 Flash: Google의 경량 모델로, 빠른 응답 속도와 낮은 비용($0.15/백만 토큰)으로 멀티모달 입력 처리를 지원하며, 일반적인 언어 생성 작업에 최적화되어 있습니다.

🔀 하이브리드 모델 (Hybrid Models)은 추론 기반 접근법과 비추론 기반 접근법을 결합한 모델입니다. 일반적인 언어 이해 능력과 복잡한 추론 능력을 동시에 갖추어 다양한 작업에서 균형 잡힌 성능을 제공합니다.

대표적인 하이브리드 모델:

GPT-5.1: 2025년 11월 출시된 OpenAI의 최신 모델로, Instant와 Thinking 두 가지 버전을 제공합니다. 적응형 추론으로 작업 난이도에 따라 자동으로 사고 깊이를 조절하며, apply_patch와 shell 도구를 새롭게 지원합니다.
Claude Sonnet 4.5: 2025년 9월 출시된 Anthropic의 최신 모델로, 코딩, 에이전트, 컴퓨터 사용에서 최고 성능을 보입니다. OSWorld 벤치마크 61.4%로 1위를 기록했으며, 100만 토큰 컨텍스트를 지원합니다.

구분	추론 모델	비추론 모델	하이브리드 모델
대표 모델	GPT-5.1 Thinking, Gemini 3 Pro	GPT-5.1 Instant, Gemini 2.5 Flash	GPT-5.1, Claude Sonnet 4.5
주요 활용 분야	복잡한 문제 해결, 프로그래밍, 수학적 증명, 논리 퍼즐	일반 대화, 콘텐츠 생성, 텍스트 요약, 감정 분석	범용 AI 비서, 에이전트 워크플로우, 코딩, 연구 지원
장점	정확한 사고 과정 제시, 복잡한 문제 해결 능력	빠른 응답 속도, 자연스러운 대화, 리소스 효율성	적응형 추론, 상황에 따른 자동 모드 전환
단점	컴퓨팅 자원 소모 큼, 느린 응답 속도	복잡한 문제 해결 어려움, 논리적 오류 발생	최고 성능 모드 사용 시 비용 증가
비용 효율성	낮음 (고비용)	높음 (저비용)	중간 (모드에 따라 조절 가능)

Model Context Protocol (MCP) 소개

Model Context Protocol (MCP)는 Anthropic이 2024년 11월 25일에 발표한 오픈 표준으로, 대형 언어 모델(LLM)과 외부 데이터 소스 및 도구 간의 통합을 표준화하여 AI 시스템이 다양한 컨텍스트를 실시간으로 활용할 수 있도록 합니다.
"쉽게 말하면, AI가 더 똑똑하게 일할 수 있도록 돕는 새로운 기술로서 AI가 다양한 자료를 찾아보고 필요한 도구를 직접 사용할 수 있게 만들어주는 표준 규칙입니다."

📌 MCP가 하는 일

자료를 연결해줍니다: 인터넷이나 회사 내부 자료를 AI가 쉽게 찾아볼 수 있게 해줍니다.
도구를 사용하게 합니다: 계산기나 검색기처럼 AI가 필요한 도구를 직접 사용할 수 있게 해줍니다.
모든 AI에 사용 가능합니다: 특별한 AI 하나에만 필요한 게 아니라, 여러 AI가 함께 쓸 수 있게 만들었습니다.

🔧 MCP 안에는 무엇이 있을까요?

호스트(Host): 사람 대신 AI가 활동하는 곳입니다.
클라이언트(Client): 호스트와 연결해주는 다리 역할을 합니다.
서버(Server): 자료나 도구를 실제로 보관하고 있는 곳입니다.

🧩 MCP로 할 수 있는 것

자료(Resource) 사용하기: AI가 필요한 문서나 데이터를 쉽게 찾아볼 수 있습니다.
도구(Tool) 사용하기: 복잡한 계산이나 특정 작업을 직접 처리할 수 있습니다.
프롬프트(Prompt) 사용하기: 필요한 질문이나 명령어를 더 쉽게 만들 수 있습니다.

🚀 MCP가 있으면 좋은 점

코딩: 프로그램 코드를 더 빠르고 똑똑하게 작성할 수 있습니다.
AI 비서: 회사 문서나 고객 정보를 빠르게 찾아 대답할 수 있습니다.
데이터 분석: 복잡한 데이터도 쉽게 물어보고 답을 얻을 수 있습니다.

🔒 보안 및 신뢰성

MCP는 강력한 기능을 제공하는 만큼, 보안과 신뢰성 확보가 중요합니다. 인증, 권한 관리, 데이터 무결성 검증 등의 메커니즘을 통해 안전한 통신을 보장합니다.

📚 추가 자료

주요 생성형 AI 모델 현황(2025년 12월)

모델버전	주요 특징	출시일	비고
GPT-5	추론과 비추론 기능 통합, Auto/Fast/Thinking 모드	2025-08	AIME 2025 수학 94.6%, SWE-bench 코딩 74.9% 달성
GPT-5.1	적응형 추론, Instant/Thinking 버전 제공	2025-11	동적 사고 시간 조절, apply_patch·shell 도구 지원. 현재 ChatGPT 기본 모델
Claude Sonnet 4.5	코딩, 에이전트, 컴퓨터 사용 최적화	2025-09	OSWorld 벤치마크 61.4% 1위, 100만 토큰 컨텍스트 지원
Claude Opus 4.5	Anthropic 최고 성능 모델, 에이전트 특화	2025-11	복잡한 장기 실행 작업 및 에이전트 워크플로우에 최적화
Gemini 3 Pro	추론, 멀티모달, 코딩 벤치마크 최고 성능	2025-11	Deep Think 모드 지원, $2/백만 토큰. Gemini 앱 6.5억 사용자
Gemini 2.5 Flash	빠른 응답, 저비용 멀티모달 처리	2025-06	$0.15/백만 토큰, 일반 작업에 최적화된 경량 모델

생성형 AI의 핵심 개념

개념	정의	실생활 비유	중요도
모델 구조 관련 개념
파라미터	AI 모델이 학습하고 저장하는 수치들의 집합으로, 모델의 지식과 능력을 결정짓는 핵심 요소.	사람의 뇌 시냅스처럼, 더 많은 연결이 더 복잡한 사고를 가능하게 함	핵심
멀티모달	텍스트, 이미지, 음성 등 여러 형태의 입력을 동시에 처리할 수 있는 AI 모델의 능력입니다. GPT-4o가 대표적.	사람이 보고, 듣고, 읽으면서 동시에 정보를 처리하는 것처럼	핵심
임베딩	텍스트나 이미지를 AI가 이해할 수 있는 고차원의 숫자 벡터로 변환하는 과정입니다.	도서관의 책 분류 체계, 비슷한 주제는 가까운 위치에 배치	중요
텍스트 처리 관련 개념
토큰	AI가 처리하는 텍스트의 최소 단위로, 단어나 부분 단어를 토큰으로 분리하여 처리합니다.	단어를 구성하는 자음과 모음, 또는 문장을 구성하는 단어들	핵심
컨텍스트 윈도우	AI가 한 번에 처리하고 기억할 수 있는 텍스트의 최대 길이입니다.	한 번에 읽고 이해할 수 있는 토큰의 양	중요
생성 제어 관련 개념
프롬프트 엔지니어링	AI에게 더 정확하고 원하는 결과를 얻기 위해 입력값을 체계적으로 설계하는 기술입니다.	원하는 결과를 얻기 위해 질문을 정교하게 다듬는 과정	핵심
스키마(Schema)	AI의 출력 형식을 미리 정의하여 일관된 구조의 응답을 받을 수 있게 하는 틀입니다. JSON, XML 등의 형식으로 지정할 수 있습니다.	요리 레시피처럼, 결과물의 형식과 구조를 미리 정해두는 것	핵심
Temperature	AI 응답의 창의성과 무작위성을 조절하는 0~1 사이의 값입니다.	1에 가까울수록 창의적인 답변을 반환환	중요

주요 생성형 AI 서비스 현황

분야	서비스명	주요 특징	제공사
텍스트 생성	ChatGPT (GPT-4o)	멀티모달 지원, 실시간 대화형 AI	OpenAI
	Claude 4.0 Sonnet	고급 추론 및 확장 사고 모드 지원	Anthropic
	Gemini 2.5 pro	멀티모달 처리, 구글 생태계 통합	Google DeepMind
이미지 생성	Imagen 3	고품질 이미지 생성, 빠른 처리 속도	Google
	FLUX Pro 1.1 Ultra	스타일 제어 강화, 높은 사용자 만족도	BlackForestLabs
	Midjourney V7	예술적 이미지 생성, 스타일 다양성	Midjourney
비디오 생성	Veo 3	고품질 비디오 생성, 빠른 렌더링	Google DeepMind
비디오 생성	Runway	AI 기반 영상 생성 및 편집, 실시간 협업	Runway
생산성 도구	Notion AI	문서 요약, 자동화된 콘텐츠 생성	Notion
생산성 도구	Gamma	프레젠테이션 자동 생성, 디자인 지원	Gamma
생산성 도구	Napkin	아이디어 정리 및 시각화 도구	Napkin
검색 기능	Perplexity AI	실시간 검색 기반 응답, GPT-4 Turbo 및 Claude 3 통합	Perplexity AI
	Liner	생성형 웹 검색, 개인화된 정보 제공	Liner
	Felo	AI 검색 및 자료 정리, 마인드맵 생성	Sparticle
	Genspark	다중 모델 응답, 무료 사용 가능	Genspark

💡 AI 서비스 선택 시 고려사항

사용 목적에 맞는 특화 기능 여부
한국어 지원 수준
가격 정책 및 사용량 제한
데이터 보안 및 프라이버시 정책
API 제공 여부 및 통합 가능성

다음 강의로

제1강 : 생성형 AI의 기초