AI-Prompthon

AI프롬프톤 워크샵 24.04.02 ~ 24.04.03

2024.04.02

마이크로소프트 공개 데이터 -> MSCOCO DataSet

분석하기 위해서는 GPU가 필요하며 nvidia가 압도거 퍼포먼스를 제공함 AI 모델을 만들기 위해서는 많은 시간과 비용 소요되어 일반적인 회사가 하기 쉽지 않으며, OpenAI와 같은 기존 분석 모델을 잘 활용하는 것을 고민할 필요가 있음

GPT-3 데이터 -> 토큰화 - 토큰ID - 어텐션(단어 간의 영향도 파악)

GPU 설치 노드 간 모델 학습이 잘 되려면 별도의 밴드폭이 필요하며 이는 인피니밴드를 통해 해결

Phi-2 - sLLM - 무료로 공개됨

RAG

벡터기반
하이브리드기반
- ex)아버지, 아빠, 대디 등 같은 의미이지만 단어로 찾으면 올바른 해답을 얻을 수 없으므로 벡터 기반으로 변경하면 단어 유사도에 따라 비교적 정확한 답변을 얻을 수 있음

Fine Tuning

프롬프트

커닝햄의 법칙(Cunningham's Law) : 인터넷을 통해 올바른 답변을 얻을 수 있는 가장 좋은 방법은 질문이 아니라 잘못된 답변을 게시하는 것.

Prompt Injection : 악의적으로 조작하여 목표하는 결과를 얻지 못하게 함 Prompt Leaking : 대외적으로 공개되지 않아야 할 정보가 공개되는 것

jailbreaking chatgpt : 막아놓은 규정들을 어기고 답하도록 하는 것을 지칭함

hallucination : 실제로 존재하지 않거나 정확하지 않은 정보를 만들어 내는 것

2024.04.03

temperature max_tokens

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md

Provide feedback