분류 전체보기 16

4-3. 생성형 AI와 LLM, RAG, AGENT까지

이제 드디어 마지막이다. 드디어 마지막으로 이걸 쓸 것이다. 이제 이거 말고 학교 공부를 할 것이다.기초세션이 이걸로 마지막이 되었다. 헤헤헿DOBY IS FREE!! 1. 생성형AI생성형 AI란생성형 AI는 기존 데이터를 그대로 외우는 것이 아니라 데이터가 만들어지는 패턴과 구조를 학습해 새로운 데이터를 만들어내는 모델이다. 여기서 새로운 데이터 생성이란 완전히 랜덤한게 아니라 학습한 데이터와 비슷한 특징을 가지면서도 이전에 존재하지 않았던 결과를 의미한다. 예를 들어, 음악 데이터를 학습해서 새로운 멜로디를 생성하는 것이 이에 해당한다. 즉, 생성형 AI는 데이터를 “재현”하는 것이 아니라 “데이터의 규칙을 배워서 새로운 결과를 만드는 것”이다. 생성형 AI를 이해하는 핵심 관점 생성형 AI를 ..

4-2. Transformer와 Attention

이번 블로그에선 4주차 세션 발표 내용인 에 대해 다뤄볼 것이다. 벌써 3학년 학부 생활도, 시냅스 활동도 중반을 지나 4주차가 되어가고 있다. 1. 시퀀스 모델의 발전과 기존 모델의 한계시퀀스 모델(Sequence Model)은 순서가 있는 데이터를 처리하거나 생성하는 데 사용되는 ML/DL 모델이다. 앞의 단어가 뒤에 올 단어에 영향을 미치는 텍스트, 음성 데이터나 시계열 데이터(주식 데이터 등)처럼 순서가 필수적인 데이터를 처리하는 데 쓰인다. RNN과 LSTM의 문제전통적인 시퀀스 모델인 RNN(Recurrent Neural Network)은 딥러닝 기반 시퀀스 모델의 가장 기본적인 형태로, 이전 입력의 정보를 순환 구조로 기억하며 처리하는 방식이다. 하지만 긴 문맥을 처리하는 데 한계가 있..

카테고리 없음 2026.04.03

4-1. NLP 기초: 단어를 숫자로

이번 블로그에선 NLP 기초: 단어를 숫자로 변환하는 방법과 인공신경망 모델들에 관해 작성할 것이다. 벌써 6주차가 되어가고 있고, 이번 시냅스 세션 발표 자료를 바탕으로 NLP의 기본기를 톺아볼 것이다. 절반이 지났으니 더 열심히 해보자! 0. 자연어 처리의 시작: 텍스트의 수치화컴퓨터는 우리가 사용하는 글자 자체를 이해하지 못하고 숫자만 처리할 수 있다. 따라서 텍스트 데이터를 수치화하는 과정이 필수적인데, 이를 벡터화(Vectorization)라고 한다. 가장 초기 방식의 벡터화 모델은 One-Hot encoding이다.One-Hot encoding의 특징: 단어 집합의 크기를 차원으로 하여, 표현하고 싶은 단어 인덱스에만 1을 부여하고 나머지는 0으로 표시하는 희소 표현 방식이다.One-Hot e..

3-3. 이미지 처리의 혁명, CNN

이번 블로그에선 인공신경망의 꽃이라 불리는 이미지 처리 모델, CNN과 그 발전 흐름에 관해 작성할 것이다.벌써 딥러닝 스터디 3주차가 되어가고 있고, 이 내용이 컴퓨터 비전의 아주 중요한 기초 세션이 될 것이다. 내용이 꽤 많고 절반이 지났으니 더 열심히 해보자! 1. MLP의 한계 (왜 새로운 모델이 필요했을까?)우선 가장 기본이 되는 인공신경망인 MLP(완전연결계층)에 이미지를 그대로 넣으면 어떤 한계가 있는지 살펴보자.대표적인 문제점은 다음과 같다.1) 파라미터 폭발이미지를 그대로 1차원으로 펼쳐서(Flatten) 입력으로 사용하기 때문에 해상도가 높아질수록 파라미터 수가 기하급수적으로 증가한다. 예를 들어 224×224×3 이미지를 flatten하면 총 입력 차원은 50,176 × 3 = 150..

3-2. 딥러닝 학습의 원리

직전 블로그에서는 인공지능의 학습의 기초인 퍼셉트론과 딥러닝의 기초에 대해 작성했었다.그러나 딥러닝의 의미와 그로 인해 얻을 수 있는 것에 대해서는 자세히 다루지 않았었다.그래서 이번 블로그에서는 신경망 학습의 핵심, 경사하강법, 모델 평가 지표, 과적합, 최적화 등에 대해 이야기 하려 한다. 1. 신경망이 학습한다는 의미 신경망이 학습한다?= 정답과의 차이를 줄이도록 내부 값(가중치, 편항)을 조금씩 바꾸는 과정 조금씩 바꾼다는 건 무엇을 어떻게 바꾼다는 걸까?입력을 넣은 후 나온 출력을 보고 기울기를 측정하여 얼마나 수정해야 하는지 알려준다. 2. 딥러닝에서의 수학1) 미분으로 얻는 기울기그럼 기울기가 무엇인가? 다들 대학생이면 알겠지만 어떤 변수를 아주 조금 바꾸었을 때, 함수값이 얼마나 변하는지를..

3-1. 인공신경망과 퍼셉트론

이번 블로그에선 인공신경망과 퍼셉트론에 관해 작성할 것이다. 벌써 3주차가 되어가고 있고 다음 주차가 마지막 기초 세션이 될 것이다.절반이 지났으니 더 열심히 해보자! 0. 초기 머신러닝 모델들 초기 머신러닝 모델에는 대표적으로 선형회귀, 로지스틱 회귀, 퍼셉트론이 있다.이를 목적과 특징 및 한계로 정리해보면 아래와 같다. 선형회귀로지스틱 회귀퍼셉트론(인공신경망의 기본단위)목적연속값 예측이진 분류이진분류특징 / 한계최소제곱 가정, 선형성&이상치 민감해석 용이, 비선형 데이터에 한계선형분리 가능 시 수렴, XOR 불가 이 세가지 모델의 공통적인 점은 '구조가 단순하고 결정경계가 선형'이라는 점이다. 1. 퍼셉트론1) 퍼셉트론은 무엇인가?퍼셉트론이란 생물학적 뉴런의 구조를 본 딴 '인공 뉴런'으로 수학..

2-3. 비지도학습 & 과적합

이전 블로그까진 지도학습에 관해 작성했다.이번 블로그에선 비지도학습, 비지도학습 방법을 평가하는 방식, 차원을 줄이는 방법, 과적합이 무엇인가에 대해 작성할 것이다.먼저 비지도학습의 개념부터 시작하자. 1. 비지도학습학습 데이터에 정답(label)이 없는 학습방식으로 데이터를 통해 숨겨있는 패턴, 그룹을 파악한다.비지도학습 방법에는 대표적으로 클러스터링과 차원축소학습 방식이 있다. 2. 클러스터링클러스터링이란 유사성 또는 패턴기반으로 서로 다른 객체들을 그룹 또는 클러스터로 구성하고 분류하는 비지도 머신 러닝 알고리즘이다. 클러스터링에는 대표적으로 K-Means 클러스터링, DBSCAN 등이 있다. 먼저 K-Means 클러스터링에 대해 알아보자. 3. K-Means1) K-Means클러스터링이란유사군..