본문 바로가기
활동/2022 동계 모각코

[22동계모각코] 1회 계획 및 평가

by JJong | 쫑 2023. 1. 2.

시작 시간 : 23-01-02 오후 6시

오늘의 목표

LG Aimers: AI전문가과정 - Module 1. 『AI 윤리』,  Module 3. 『지도학습(분류/회귀)』 수강

아래에는 강의를 들으며 생소하거나 중요하다고 느끼는 등 내게 기록하고 싶은 부분만 메모하도록 하겠다.


Module 1

오늘 배운 내용은 AI윤리 뿐만 아니라 데이터 사이언티스트라면 누구나 알아야 할 소양에 대해 알아보았다. 

1. 데이터를 잘 해석하는가?

+ 상관관계와 인과관계를 제대로 알자. 이 둘 사이의 잘못된 사용은 데이터 과학자라면 절대 해선 안 되는 실수이다.

2. 데이터 전처리와 분석 방법은 적절한가?

*데이터를 깊이 분석하는 EDA(exploratory data analysis) 과정에 충분한 시간 보내기

3. 학습에 쓰는 데이터가 충분한가?

보통은 밀리언 스케일(Million Scale), 100만 데이터 건은 있어야 많은 수의 파라미터를 학습할 수 있다고 얘기한다. 그런데 모델이 너무 단순하면 충분히 학습이 되지 않는, 언더피팅(under fitting)이 일어난다. (반의어 : 오버 피팅, over fitting; 테스트 데이터에 과하게 학습한 경우, 테스트 하려는 데이터들에 대해서 유연한 처리가 안 됨)


One pixel attack : 학습 이미지의 픽셀 하나만 바꾸어도 학습 결과가 달라진다. -> 이런 공격에 취약함.


인터넷에서 이미지를 크롤링 할 때 주의해야 할 점(웹 데이터)

정보의 대표성을 띠는지 확인해야 한다. 수집한 데이터가 대중을 대표할 수 있는가?; >> Spiral of silence 알아보기(편향 현상)

진실된 정보인지 확인해야한다(오차의 범위 파악). 오정보는 빠른 속도로, 산발적으로 퍼져나가게 된다.

누군가의 권리를 침해하지 않는지 확인해야 한다.


GDPR

Digital Services Act

윤리적인 가치에 대해서 민감하게 알고, 법 제도의 변화도 따라가야 한다.


Module 3

지도 학습의 개념을 공부했다.

지도 학습에서 모델을 학습하는 과정에서는 feature selection >> model selection >> optimization 과정을 거치게 된다고 했다. 입력의 특징을 추출하고, 특징을 학습할 적절한 모델을 선택한 다음 최적해를 구하는 방법이라고 생각했다.

지도 학습 과정에서 모델에게 세상의 모든 데이터를 학습시키는 것이 아니다. 그러므로 모든 상황에서 정확할 수는 없다. 그럼에도 불구하고 우리가 관찰하지 못한 상황에 대해서도 우수한 성능을 제공할 수는 있어야 한다. 그래서 Machine Learning Model에게 있어서 중요한 것은 일반화(Generalization)라고 한다.

이런 일반화 된 모델의 정확도를 평가하기 위해 일반화 오차 E(Generalization Error E)를 정의한다. 그리고 E는 0에 가까울 수록 좋다고 한다. 그만큼 오차가 적다는 의미이기 때문이다.

이 뒤에는 Pointwise error와 Binary error을 활용해 overall error를 계산한다는 설명과 함께 이런 함수를 손실 함수(loss funtion 또는 cost funtion)이라고 불린다는 강의로 이어졌다. (최소제곱법 혹은 평균제곱오차의 시초격이 아닌가 생각했다.)

model 정확도를 높이는 일

  • bias 낮추기
  • model 일반성 높이기
  • variance(분산) 낮추기

 

  • bias와 variance의 trade off 관계

계획 세운 뒤 시작 전에 찍었다.

 

강의를 모두 수강하며 정리했다.


활동 후 소감

오늘은 원래 Module 1과 2를 수강할 계획이었으나, Module 2는 해커톤 기본 소양을 기르기 위한 강의 내용이라 흥미가 느껴지지 않았다. 그래서 결국 학습의 마지막으로 미루기로 결정했다. 본격적으로 강의를 수강하면서 내가 부족한 점들이 정말 많다는 것을 깨닫게 되었다.

강의 내용의 절반 이상이 처음 접하는 이야기였고, 설령 배경이 있다 하더라도 내가 알던 것보다 깊은 내용이었다. 그래도 내가 열심히 하는 만큼 큰 성장을 이룰 수 있을 것이라고 생각한다.

이 교육 과정을 전부는 아닐지라도 인공지능의 세 학습 방법 중(지도, 비지도, 강화) 하나라도 완전히 내 것으로 만들고 싶다. 

댓글