생성형 인공지능은 어떻게 배우는가?

— Coursera 「Introduction to Generative AI」로 살펴본 AI

최근 몇 년 사이 생성형 인공지능(Generative AI)은 기술 담론의 중심으로 빠르게 이동했다. 불과 얼마 전까지만 해도 인공지능은 연구자와 엔지니어의 영역에 가까웠지만, OpenAI의 ChatGPT가 등장한 이후 상황은 완전히 달라졌다. 이제 AI는 일상적인 업무 도구이자, 생산성을 좌우하는 핵심 인프라로 자리 잡았다. 단순한 기술 트렌드를 넘어, 업무 방식과 산업 구조 자체를 재편하는 수준의 변화가 일어나고 있는 것이다.

이 변화는 시장에서도 즉각적으로 반영된다. 애플, 마이크로소프트, 구글, 메타와 같은 빅테크 기업들은 생성형 AI를 핵심 전략으로 삼고 대규모 투자를 이어가고 있다. 이제 “AI”라는 키워드는 기업의 미래 성장성을 가늠하는 척도가 되었고, 기술 경쟁에서 뒤처진다는 인식만으로도 기업 가치가 흔들린다. 실제로 한때 혁신의 상징이었던 애플은 AI 전략에서 상대적으로 보수적인 태도를 보였다는 평가와 함께, 장기간 준비해온 애플카 프로젝트를 접으며 시장의 불안을 키운 바 있다.

이처럼 생성형 AI가 사회·경제 전반에 미치는 영향이 커지면서, 자연스럽게 이런 질문이 뒤따른다.

“도대체 생성형 AI란 무엇이며, 어떤 원리로 작동하는가?”

20분으로 압축한 생성형 AI의 핵심

이 질문에 대한 가장 간결한 입문 자료 중 하나가 바로 Coursera에 공개된 구글의 강의 “Introduction to Generative AI”다.

이 강의는 약 20분이라는 짧은 분량 안에, 생성형 AI의 개념과 구조, 그리고 실제 활용 방향까지를 빠르게 훑는다. 깊은 수학적 원리나 알고리즘 구현보다는, 비전공자도 이해할 수 있도록 큰 그림을 제시하는 데 초점을 둔다는 점에서 ‘입문용’이라는 표현이 정확하다. 하지만 짧다고 해서 얕지는 않다. 오히려 생성형 AI를 둘러싼 핵심 개념을 효율적으로 정리해 준다.

강의는 다음 네 가지 질문을 중심으로 구성된다.

생성형 인공지능이란 무엇인가
생성형 인공지능은 어떻게 작동하는가
생성형 인공지능 모델에는 어떤 유형이 있는가
생성형 인공지능은 어디에 활용되는가

생성형 AI란 무엇인가

강의에서 정의하는 생성형 AI는 다음과 같다.

“텍스트, 이미지, 오디오, 비디오, 합성 데이터 등 다양한 형태의 새로운 콘텐츠를 생성할 수 있는 인공지능 기술.”

기존의 인공지능이 ‘분류’와 ‘예측’에 강점을 가졌다면, 생성형 AI는 ‘창조’에 가까운 영역으로 확장되었다. 문장을 완성하고, 이미지를 만들어내며, 코드와 음악까지 생성하는 단계에 도달한 것이다. 이 변화의 중심에는 대규모 언어 모델(LLM)과 딥러닝 기술이 있다.

AI, 머신러닝, 딥러닝의 관계

강의는 많은 입문자가 헷갈려 하는 개념부터 정리한다.

AI → ML → Deep Learning은 포함 관계다.

인공지능(AI): 인간의 지능적 행동을 모방하는 모든 기술의 총칭
머신러닝(ML): 데이터를 통해 스스로 규칙을 학습하는 AI의 한 분야
딥러닝(Deep Learning): 인공 신경망을 활용해 복잡한 패턴을 학습하는 ML의 하위 영역

머신러닝은 다시 지도학습(Supervised), 비지도학습(Unsupervised), 강화학습(Reinforcement Learning)으로 나뉘며, 딥러닝은 이 모든 방식에 활용될 수 있다. 생성형 AI는 바로 이 딥러닝 기술을 기반으로 한 하위 범주다.

Supervised Learning vs Unsupervised Learning

— 머신러닝이 ‘배우는 방식’의 차이

머신러닝(Machine Learning)은 데이터를 통해 패턴을 학습한다는 점에서는 동일하지만, 학습에 사용되는 데이터가 어떤 형태로 주어지느냐에 따라 전혀 다른 방식으로 작동한다. 이 차이를 가장 대표적으로 구분하는 기준이 바로 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)이다. 생성형 AI를 이해하기 위해서도 이 구분은 반드시 짚고 넘어가야 한다.

지도학습(Supervised Learning)

지도학습은 정답이 미리 주어진 데이터를 사용해 학습하는 방식이다. 즉, 각 데이터에는 반드시 레이블(Label) 이 붙어 있다. 이 레이블은 이름, 유형, 숫자 값 등 예측하고자 하는 정답을 의미한다.

모델은 과거의 예시 데이터를 통해

“이 입력에는 이런 출력이 대응된다” 라는 관계를 학습하고, 이후 새로운 입력이 들어왔을 때 가장 그럴듯한 정답을 예측한다.

예를 들면 다음과 같다.

이메일 + “스팸 / 정상” → 스팸 필터
집 크기·위치·연식 + 가격 → 부동산 가격 예측
이미지 + “고양이 / 개” → 이미지 분류

이처럼 지도학습은 분류(Classification)와 회귀(Regression) 문제에 주로 사용되며, 정확도가 높고 결과 해석이 비교적 명확하다는 장점이 있다. 다만, 레이블이 붙은 대량의 데이터가 필요하다는 점에서 데이터 준비 비용이 크다는 한계도 존재한다.

비지도학습(Unsupervised Learning)

비지도학습은 말 그대로 정답이 없는 데이터를 다룬다. 모델은 데이터가 무엇을 의미하는지 미리 알지 못한 상태에서, 데이터 자체의 구조와 패턴을 탐색한다. 비지도학습의 핵심은 ‘예측’이 아니라 발견(discovery)이다.

모델은 원시 데이터를 분석해 다음과 같은 질문에 답하려 한다.

이 데이터들은 자연스럽게 몇 개의 그룹으로 나뉘는가?
서로 비슷한 데이터는 어떤 특성을 공유하는가?
이상치(비정상적인 패턴)는 어디에 있는가?

대표적인 활용 예시는 다음과 같다.

고객 행동 데이터를 기반으로 한 군집화(Clustering)
구매 패턴 분석을 통한 고객 세분화
금융·보안 분야의 이상 탐지(Anomaly Detection)

비지도학습은 인간이 미처 정의하지 못한 패턴을 찾아낼 수 있다는 강점이 있지만, 결과 해석이 직관적이지 않을 수 있고, “이게 맞는 결과인가?”를 검증하기 어렵다는 특성도 함께 가진다.

왜 이 구분이 중요한가

지도학습과 비지도학습의 차이는 단순한 기술적 분류가 아니다. 이는 AI가 문제를 푸는 철학 자체의 차이에 가깝다.

지도학습은 → “우리가 무엇을 알고 싶은지 명확할 때” 강력하다.
비지도학습은 → “우리가 무엇을 모르는지조차 모를 때” 빛을 발한다.

생성형 AI와 딥러닝 모델들은 이 두 방식을 혼합해서 사용한다. 레이블이 있는 데이터로 기본 개념을 학습하고, 레이블이 없는 방대한 데이터로 일반화 능력을 키운다.

생성형 모델과 판별형 모델의 차이

강의에서 특히 강조하는 구분은 판별형 모델(Discriminative Model)과 생성형 모델(Generative Model)이다.

판별형 모델은 “이 데이터는 무엇인가?”를 맞힌다. 예: 스팸 메일 분류, 이미지 분류
생성형 모델은 “새로운 데이터를 만들어낸다.” 예: 문장 생성, 이미지 생성, 음성 합성

즉, 판별형 모델이 경계를 긋는 기술이라면, 생성형 모델은 확률 분포를 학습해 새로운 샘플을 만들어내는 기술이다.

생성형 AI의 핵심: 트랜스포머

생성형 AI의 폭발적 성장은 트랜스포머(Transformer) 구조에서 비롯되었다. 트랜스포머는 2017년 등장 이후 자연어 처리 분야를 근본적으로 바꿨고, 이후 대부분의 대규모 언어 모델의 기반이 되었다.

트랜스포머는 인코더와 디코더 구조를 통해 문맥 전체를 동시에 이해한다. 이전 모델이 문장을 순차적으로 처리했다면, 트랜스포머는 문맥의 관계를 병렬적으로 학습한다. 이 덕분에 더 긴 문장, 더 복잡한 의미를 다룰 수 있게 되었다.

다만 이 구조에는 한계도 있다. 강의에서는 이를 환각(Hallucination)이라는 개념으로 설명한다. 모델이 그럴듯하지만 사실이 아닌 내용을 만들어내는 현상이다. 이는 데이터 부족, 문맥 부족, 제약 조건 미비 등 다양한 이유로 발생할 수 있으며, 생성형 AI의 가장 중요한 리스크 중 하나로 꼽힌다.

프롬프트와 모델 유형

생성형 AI에서 사용자의 역할은 단순한 입력자가 아니다.

프롬프트(Prompt)는 모델의 출력을 결정짓는 핵심 인터페이스다. 어떤 맥락을 주고, 어떤 조건을 설정하느냐에 따라 결과는 크게 달라진다. 이 때문에 최근에는 ‘프롬프트 엔지니어링’이라는 개념까지 등장했다.

강의는 생성형 AI의 활용 유형도 간단히 정리한다.

텍스트 → 텍스트
텍스트 → 이미지
텍스트 → 비디오 / 3D
텍스트 → 태스크 수행

이 모든 응용의 기반에는 기반 모델(Foundation Model)이 존재한다. 기반 모델은 다양한 작업에 재사용될 수 있는 대규모 범용 모델로, 산업 전반에서 핵심 인프라로 활용된다.

구글의 생성형 AI 생태계

강의 후반부에서는 구글의 생성형 AI 도구들이 소개된다.

Google의 Vertex AI는 기반 모델을 포함한 Model Garden을 제공하며, 언어·비전·멀티모달 모델을 한 플랫폼에서 다룰 수 있도록 설계되었다.

특히 PaLM API와 MakerSuite는 개발자가 대규모 언어 모델을 빠르게 실험하고 서비스로 확장할 수 있도록 돕는다. 여기에 더해, 최근 주목받는 Gemini는 텍스트, 이미지, 오디오, 코드까지 동시에 이해하는 멀티모달 모델로, 기존 언어 모델의 한계를 확장하고 있다.

입문 강의로서의 가치

이 강의는 생성형 AI의 내부 수학이나 알고리즘을 깊게 파고들지는 않는다. 대신, 왜 이 기술이 중요한지, 어디에 쓰이고 있는지, 어떤 구조 위에 서 있는지를 짧은 시간 안에 정리해 준다. 그 점에서 이 강의는 ‘이해를 위한 지도’에 가깝다.

생성형 AI에 대해 막연한 호기심은 있지만, 어디서부터 시작해야 할지 모르는 사람에게 이 강의는 훌륭한 출발점이 된다. 생성형 AI는 더 이상 먼 미래의 기술이 아니다. 이미 우리의 업무, 창작, 의사결정 속으로 깊숙이 들어와 있다.

이제 중요한 질문은 하나다. “이 변화를 관망할 것인가, 이해하고 활용할 것인가.” Coursera의 「Introduction to Generative AI」는 그 질문에 답하기 위한 가장 부담 없는 첫걸음이다.

🚩 Introduction to Generative AI

주제 : 컴퓨터과학, 인공지능
코세라 : http://app.ac/GACROu503

생성형 인공지능은 어떻게 배우는가?

— Coursera 「Introduction to Generative AI」로 살펴본 AI

20분으로 압축한 생성형 AI의 핵심

생성형 AI란 무엇인가

AI, 머신러닝, 딥러닝의 관계

Supervised Learning vs Unsupervised Learning

— 머신러닝이 ‘배우는 방식’의 차이

지도학습(Supervised Learning)

비지도학습(Unsupervised Learning)

왜 이 구분이 중요한가

생성형 모델과 판별형 모델의 차이

생성형 AI의 핵심: 트랜스포머

프롬프트와 모델 유형

구글의 생성형 AI 생태계

입문 강의로서의 가치

🚩 Introduction to Generative AI

대로변에서 만나는 익숙한 맛 — 명동교자 신관명동역점

명동 골목 속에 남아 있는 밥집 — 삼보식당

명동 골목 끝에서 만난 한 그릇 — 미성옥 설렁탕

카노우 미유, 4월 12일 LOVE FM ‘카노우의 SAY!’서 팬미팅·F1·하카타역 무대까지 근황 공개