전체 글90 2024년 SQLD 합격 후기, 3주 공부법 입사 전에 스펙겸 SQLD를 지원했는데 어찌어찌 취업에 성공했고 취업 전에는 도저히 공부할 마음이 들지 않아 취업 직후 3주 동안 최악의 컨디션으로 공부했다. 최근 공부하면서 이정도로 잠이 온 적이 있었나? 싶을 정도로 졸았지만 틈틈이 공부해서 어떻게든 합격은 가능했다. 조금 막힐때마다 시간을 쓰기보다는 더 흡수력 좋은 자료를 찾아내서 시간을 아낄 수 있었던것 같다. 내가 어떤 컨텐츠로 공부했고 각각 어떤 점이 도움이 됐는지 간단히 적어보려 한다. 참고로 나는 AI 개발자로 DB를 다뤄본 경험은 거의 없다. 간단한 select, insert 정도가 전부이고 create가 기존에 사용해본 가장 어려운 문법이었다.학습컨텐츠 정리 SQL 자격검정 실전문제 - 예스24SQL 자격검정 실전문제는 국가공인 S.. 2024. 9. 21. WSL VScode에서 SSH 에러 (Could not establish connection to "ip")해결방법 기존에도 WSL+VS code+SSH를 사용해 원격에 자주 접속한 적이 있어 이번에 회사에서 똑같이 따라하려다 황당한 에러가 나서 해결법은 공유하려 한다. TL;DRvscode에서 IdentityFile에 wsl경로를 리눅스(폴더에 "/" 사용)가 아니라 윈도우로 바꿔주면 해결할 수 있다. 문제파악VScode에서 SSH를 사용할 때 대게 위와 같은 형식을 사용한다.이번에난 에러에서 중간 부분을 잘라왔는데 중간에 기존 IdentityFile로 지정한 id_rsa 파일이 존재하지 않는다고 경고하는걸 볼 수 있다. 폴더 위치를 재확인했을 때 문제가 없어서 무언가 내가 모르는 귀찮은 일이 일어났다는걸 파악했고 바로 검색에 들어갔다.해결과정https://github.com/microsoft/vscode-remot.. 2024. 9. 20. NLP_2 Chapter12Tagging대표적인 태깅 taskNER(개체명 인식): 단어가 사람, 장소, 단체인지 유형 확인POS tagging(품사 태깅): 말 그래도 명상, 동사 형용사 등 품사 확인태깅을 위해서 X의 길이에 맞게 y를 만들어야 하고 이를 시퀀스 라벨링이라고함BIO 표현: 개체명 표현같은거에서 Begin, In, Out을 의미하는듯 각각 시작, 속함, 아무것도 아닌을 의미즉 NER같은 경우 개체당 한 column이 들어가 원핫 느낌이 되는게 아니라 한 차원내에서 모든 개체를 다룸Chapter13BPE:서브워드를 만들어주는 알고리즘 중 하나. 두개의 단어를 하나로 묶는데 순서는 1.빈도수 2. 앞에서부터기존 OOV였던 lowest를 문자 단위로 쪼개고 유사한 문자 집합을 찾아낼 수 있음13-04 .. 2024. 9. 10. NLP_1 Chapter2토큰화(tokenization):자연어는 문서(document)->문장(sentence)->단어(word)->문자(character?) 순서로 데이터를 쪼갤 수 있다.토큰화는 이 중 문장을 단어로 쪼개주는 과정을 의미한다. 주로 띄어쓰기나 품사 단위로 자르는데 한국어는 접미어로 다양한 형태를 가질 수 있으므로 형태소(말의 가장 작은 단위)로 잘라주어야 한다.from nltk.tokenize import word_tokenizeprint('단어 토큰화1 :',word_tokenize("Don't be fooled by the dark sounding name, Mr. Jone's Orphanage is as cheery as cheery goes for a pastry shop."))단어 토.. 2024. 9. 10. Pytorch-GradCAM 치트시트 이번에 신입 프로젝트를 진행하며 처음으로 GradCAM을 써봤는데 그 사용법에 대해 정리해보려 한다. 현재 pytorch에서 GradCAM을 구현한 레포 중 가장 대표적인 건 https://github.com/jacobgil/pytorch-grad-cam 이건데 사용법은 분명 다 나와있는데 조금 직관적이지 않다고 느껴 한 번 정리하고 싶었다.Pytorch GradCAM일단 설치부터 한다.pip install grad-cam 라이브러리 가져오고 적당히 설정을 한 다음import timmimport osimport randomfrom collections import defaultdictfrom importlib import import_moduleimport numpy as npimport pandas a.. 2024. 9. 7. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows(2021) 리뷰 ViT의 등장 이후 이를 베이스로 다양한 형태의 variants가 쏟아져 나오기 시작했다. 이번에는 그중 가장 대표적으로 알려진 backbone 중 하나인 Swin Transformer에 대해 리뷰해 보겠다. Background이전까지는 Abstract, Introduction 등 논문의 진행을 그대로 따라갔는데 ViT base backbone 연구모델은 대게 흐름이 비슷하다고 느껴 이번 글에서는 주요한 부분만 빠르게 짚어보겠다. ViT는 JFT-300M을 pretrain해 IM1K에 대해 SOTA를 달성했다. 하지만 이는 pretrain에 한정된 이야기이고 ViT의 고질적 단점 이자 장점 low bias to image = concerate to general information으로 인해 IM1K p.. 2024. 9. 1. 캐글 노트북에서 기존 터미널과 똑같이 split하기 이 글은 window or wsl에서 모델을 돌리면서 그 결과를 캐글에서 시각화하고 싶은 특이한 상황에 대처하기 위해 쓴 글이다.문제 상황모델을 풀로 학습시키면서 추가로 validation결과를 보고 싶어서 캐글에 기존 코드, 데이터를 전부 넣고 예측했는데 예측결과가 과하게 좋았다.확인해 보니 기존 valid set과 캐글에서 사용한 valid set의 라벨 비율, 그리고 dataset의 label 순서는 맞았지만 파일명 순서는 맞지 않았다. random seed, python version, numpy 같은 라이브러리 버전 등등 모두 확인했지만 문제는 없었고 투자한 시간에 대비 아무 성과가 없어 GPT와 스택오버 플로를 마구 뒤졌다.해결법놀랍게도 해결법은 어이없을 정도로 단순했다. 이번 코드에 과거 V.. 2024. 8. 26. timm 정리 이미지 분류 모델을 만들 때는 backbone을 가져올 때 주로 timm을 사용할 때가 많다. torchvision은 최근 모델 업데이트가 느리고 mmdetection은 이미지 분류에 사용하기에는 수고가 너무 많이 든다고 생각한다.timm은 유명한 모델 아키텍처는 간단히 클래스로 간단히 불러올 수 있다. timm 모델 사용법##model.pyimport timmclass TIMM(nn.Module): def __init__(self, model): super().__init__() self.model = timm.create_model(model, pretrained=True, num_classes=1) self.layer = nn.Sigmoid() def.. 2024. 8. 25. 이전 1 2 3 4 5 6 ··· 12 다음