목록분류 전체보기 (66)
데이터 놀이터

오늘의 키워드 터미널 CLI vs GUI 가상 환경 아나콘다 깃, 깃 허브 1. 개념 정리 1. 터미널과 CLI 터미널 (terminal) 오직 글자로 컴퓨터에게 명령을 전달할 수 있는 창구 CLI (Command Line Interface) 터미널에서 명령이 전달되고 컴퓨터가 이를 수행하는 과정을 CLI라고 부른다. 마우스를 이용하는 GUI(Graphical User Interface)와 반대되는 개념 GUI의 경우 마우스, 커서 등 명령을 내리고 수행하는 과정에서 상당한 자원을 소모하기 때문에 CLI에 비해 비효율적 Python, Git, Docker 등 모두 CLI 기반으로 개발되고 사용되기 때문에 사실 개발을 하고자 하는 우리에게는 선택권이 없다.. Directory 파일을 분류하기 위해 사용하는..
1. 머신러닝 의의 인공지능의 하위 개념으로 지도학습 방법이다. 지도학습은 컴퓨터에게 데이터와 답을 주고 인간이 발견하기 힘든 규칙과 패턴을 찾아내도록 학습하는 방법이다. 용어 정리 데이터 : 데이터셋은 데이터의 특성(feature)과 답(target)으로 이루어져 있음 모델 : feature과 target 간의 수학적 관계를 정의한 것 훈련(Training) : feature와 target 간 유의미한 패턴과 규칙을 찾아 더 나은 모델을 만들고자 하는 과정 평가(Evaluation) : 예측 모델이 새로운 데이터를 투입했을 때 얼마나 유의미한 예측을 할 수 있을지 판단하는 과정, 평가 시 만족스러운 결과가 나오지 않는다면 훈련 단계로 돌아감 추론(Inference) : 평가를 통과한 예측 모델에 새로운..
1. Bayes Theorem (베이지안 이론) 베이지안 이론은 사전 확률(prior)을 통해서 얻은 증거를 토대로 사후 확률(posterior)을 구하는 과정을 반복함으로써 점점 객관적인 지표를 찾아나가는 이론이다. 이를 이해하기 위해서는 이항 분포, 조건부 확률 등에 대한 이해가 필요하다. (1) 이항 분포 (Binomial Distribution) Yes or No 또는 구매/비구매 등 한 사건에 대해서 가능한 선택지가 2개인 분포를 말한다. 가장 대표적인 예시가 동전 던지기로 동전을 n번 던져 앞면이 k번 나올 확률을 구하는 것이다. 먼저 n번을 던져 앞면이 k번 나올 경우의 수를 구한 뒤 이에 맞는 확률을 곱해주면 된다. # n번 던져서 k번 앞면이 나올 경우의 수 nCk -> n!/k!(n-k..

1. EDA (Exploratory Data Analysis) 탐색적 데이터 분석, 말 그래도 데이터 분석을 위해 데이터를 탐색하는 과정이다. 마치 우리가 요리를 하기 전에 재료의 특성, 조리법 등을 알아야 하듯이 데이터 분석을 하기 전에 데이터가 어떤 특성, 분포를 갖고 있는지를 알아보는 중요한 단계다. EDA를 수행하기 위해서 pandas 메서드, Feature Engineering, 통계치 및 시각화를 활용한다 (1) pandas 메서드 먼저 통계치를 이용하는 방법에는 다음과 같은 코드가 있다. 모두 pandas의 메서드이다. df.shape # 행, 열의 수 df.info() # 열 별로 결측치, 데이터타입 등을 종합적으로 파악 가능 df.isnull().sum() # 결측치 수 df.dtypes..

2022년 12월 1일에 코드스테이츠 AI 부트캠프 합격문자를 받았고, 12월 9일(금)부터 수업을 듣게 되었다. 코드스테이츠에 왜 지원하게 되었는지, 그리고 앞으로 어떻게 공부를 이어나갈지 각오를 적어보려고 한다. 1. 지원 동기 사실 처음부터 가고 싶었고 준비했던 부트캠프는 SSAFY였다. 아무래도 탄탄한 커리큘럼과 삼성이라는 대기업이 주는 신뢰감이 컸던 것 같다.(지원금도 월 100만원..!) 하지만 SSAFY에서는 내가 원하던 데이터 분야과 관련된 교육이 진행되고 있지 않았다. 이 때문에 지원동기를 묻는 에세이 작성 과정에서 많은 어려움을 겪었다. 최종 지원을 마친 후 파이썬과 데이터 관련 교육을 진행하는 부트캠프를 더 알아보게 되었다. 여러가지 부트캠프들이 있었지만 코드스테이츠를 선택한 이유는 ..

#1 글을 작성하고 블로그를 관리해보세요. 님의 회원 가입을 진심으로 축하합니다. 이 글은 비공개로 작성돼 있습니다. '편집'으로 내용을 바꾸시거나, 삭제 후 '새 글을 작성'하셔도 됩니다. 글 뿐만 아니라 블로그의 각종 설정을 변경할 수도 있습니다. '블로그관리'를 확인해보세요. #2 다양한 스킨이 있어요. 티스토리에 있는 다양한 '스킨'도 살펴 보세요. 블로그나 사이트를 사용하는 목적에 맞게 스킨을 고를 수 있습니다. 어떤 이야기를 주로 하실 건가요? 잘 생각해 보시고, 마음에 드는 스킨을 고르세요. '스킨 편집'을 통해 다양한 커스텀, 그리고 홈 꾸미기를 적용하실 수도 있답니다. #3 포럼에서 사람들과 소통하세요. 마지막으로 사용하시다가 티스토리에 대해 궁금한 내용이 있다면 '포럼'을 확인하세요. ..