본문 바로가기
728x90
SMALL

분류 전체보기118

스타트업 투자 라운드(시드단계, 시리즈 A, 시리즈 B, 시리즈 C) 1. 글을 쓰게 된 계기 오늘은 우리가 처음 투자를 받게 된 날이다. 하지만 아직 나는 스타트업에 대해서 정말 모른다. 그래서 하나씩 공부하고자 하고, 그 첫번째가 투자 타운드에 대해서 설명하고자 한다. 2. 투자 라운드 투자 라운드는 스타트업에서 필요로 하는 투자를 기업 성장 단계, 투자 회차 및 규모에 따라 구분해 놓은 것이다. 일반적으로는 시드 단계 -> 시리즈 A -> 시리즈 B -> 시리즈 C로 구분되어 진다. 대부분의 스타트업은 아이디어와 기술을 제품 서비스로 발전시키고 이를 시장에 출시하는 것을 반복하며 성장한다. 자체적인 수익만으로 연구개발을 꾸준히 하면서 기업 규모까지 키우는 건 대부분의 스타트업에서 거의 불가능하다. 그래서 더 큰 성장의 타이밍을 앞둔 스타트업들은 이를 뒷받침할 투자 자.. 2023. 11. 28.
jupyter notebook 서버설정, 원격접속 설정(feat. ubuntu 22.04) 1. 글을 작성하게 된 계기 jupyter notebook을 통해 서버에 접속해서 코딩을 하는 경우가 많다. (리소스 자원 또는 공간의 제약을 이겨내기 위해) 그래서 이번에는 새로운 환경에서 jupyter ntoebook을 서버에 접속하도록 하는 글을 정리하고자 한다. 2. jupyter notebook 서버 및 원격접속 설정 방법 1. jupyter notebook 설치 pip install jupyter notebook 2. 방화벽 해제 # ubuntu sudo ufw allow 8888 3. config 파일 생성 jupyter notebook --generate-config 아래와 같이 config 파일이 생성된 것을 확인할 수 있음 /home/jongsky/.jupyter/jupyter_note.. 2023. 11. 6.
[논문 리뷰] Data-Juicer: A One-Stop Data Processing System for LargeLanguage Models (23.10) (this version, v2) LLM의 엄청난 발전은 다양하고 다량의 높은 품질의 데이터의 중요성을 강조했습니다. 데이터 레시피(data recipe)는 LLM을 훈련하기 위한 다양한 소스 데이터들을 혼합한 것으로, LLM의 성능을 결정하는 가장 중요한 요인으로 알려져있습니다. 존재하는 오픈 소스 도구는 주로 특정 데이터 레시피를 준비하는데에 맞춰져 있습니다. LLM의 잠재력을 지속적으로 발견하고, 새로운 소스로 부터 데이터를 통합(incorporate), LLM의 성능을 향상시키기 위해, 우리는 Data-Juicer라 불리는 새로운 시스템을 개발했습니다, 시스템을 통해 다양한 데이터 레시피를 효율적으로 생산하고, 데이터 혼합물을 형성하는 다양한 가능성을 탐색하며, 그리고 모델의 성능에 미치는 영향을 평가할 수 있습니다. 전통적인 데.. 2023. 11. 3.
[논문 리뷰] A PARADIGM SHIFT IN MACHINE TRANSLATION:BOOSTING TRANSLATION PERFORMANCE OF LARGELANGUAGE MODELS (23.09) 생성형 LLM은 다양한 NLP 테스크에 대해 놀라운 진전을 이뤄냈습니다. 그러나, 이러한 진전은 번역 문제에 대해서는 반영되지 않아습니다, 특히 중간 규모 모델(7B 또는 13B 파라미터)은 기존의 supervised encoder-decoder 번역 모델들보다 뒤쳐져 있습니다. 기존 연구들은 중간 규모 모델의 번역 능력을 향상시키기 위해 시도한 적이 있지만, 그들의 성과는 제한적이었습니다. 본 연구에서는 전통적으로 번역 모델이 의지했던 방대한 parallel data가 필요하지 않은, 번역 테스크를 위해 특별히 설계된 LLM에 대한 새로운 fine-tuning 접근 방식을 제안한다. 2단계의 fine-tuning 으로 구성된 접근 방식: 단일 언어에 대한 초기 fine-tuning + 소규모 고품질 p.. 2023. 11. 1.
과학 글쓰는 방법 (feat. 연구계획서, 논문작성법) 연구 계획서 작성하는 방법 제목 설계 (Title Design): 이 부분에서는 연구의 핵심 주제를 간결하게 나타내는 제목을 제안합니다. 제목은 연구의 내용을 요약하고 주요 관심사를 나타내야 합니다. 문제의 정의 및 필요성 (Problem Definition and Significance): 연구 주제의 중요성과 관련 문제를 정의합니다. 연구가 왜 필요한지, 어떤 사회적 또는 학문적 이슈를 다루는지 설명합니다. 기존 연관 연구결과의 조사 (Review of Related Work): 해당 분야의 이전 연구나 문헌을 조사하고, 연구 주제와 관련된 이전 연구 결과를 간단히 요약합니다. 이로써 연구의 현존 지식 기반을 보완할 수 있습니다. 연구의 구체적 목표 (Specific Research Objective.. 2023. 10. 21.
Machine Learning(기계학습)의 전반적인 개요 Machine Learning (기계학습) 컴퓨터 스스로 대용량 데이터에서 지식이나 패턴을 찾아 학습하고 예측을 수행하는 것 컴퓨터가 학습할 수 있게 하는 알고리즘과 기술을 개발하는 분야 train 데이터를 머신러닝을 적용해서 학습시키고, 이 학습 결과로 모형이 생성됨 구분 유형 알고리즘 지도 학습 (supervised learning) 분류(classification) - K-최근법 이웃 (K-Nearest Nighbor, KNN) - 서포트 벡터 머신 (Support Vector Machine, SVM) - 결정 트리 (decision tree) - 로지스틱 회귀 (logistic regression) 회귀(regression) - 선형 회귀 (linear regression) 비지도 학습 (unsu.. 2023. 10. 21.
728x90
LIST