4월 20일에 온라인으로 참석했던 세미나인데 늦게나마 작성해 보는 참석 후기
링크를 통해서 들어가면 다시보기를 볼 수 있기 때문에 관심 있다면 한번 보시면 좋을 것 같다. 라이브 당시에는 동시통역을 해주시는 분들이 있었지만 다시 보기에 자막은 없어서 이해하는데 조금 불편할 수는 있다. 그래도 슬라이드에 텍스트가 있고 코드 예제의 경우 일시 정지하고 직접 돌려볼 수 있으니 라이브를 볼 때보다 관심 있는 부분에 더 집중해서 볼 수 있는 장점이 있다. 이번 세미나의 어젠다는 아래와 같다.
ChatGPT로 인한 새로운 패러다임
27차 Tech 세미나 진행합니다. 이번 Tech 세미나는 특별히 글로벌 온라인 강의 플랫폼인 Udemy와 함께 합니다. ChatGPT로 인한 새로운 패터다임이라는 주제로 Udemy의 대표 강사님들을 모셨습니다. 첫번
devocean.sk.com
어젠다
세션 1: GPT-4와 Chat-API 세계 탐구
- Intro to OpenAI products and APIs
- Comparing GPT 3, 3.5, and 4
- Introducing the Chat API with GPT 4
- Important API parameters - Tokens, Temperature, Frequency Penalty
- Use Cases - Summarization, Information Extraction, Sentiment Analysis, Translation
- Project Demos
세션 2: 데이터 과학을 위한 ChatGPT
- Intro into Generative AI and prompt engineering
- How Gen AI can save dozens of hours a month on data science projects
- How Gen AI can help those who don’t have experience in data science, execute projects in it
- Data exploration and analysis
- Collaboration and communication
- Using ChatGPT in data visualization, Communicating insights and defending them, Project meetings preparation
후기
세션 1: GPT-4와 Chat-API 세계 탐구
ChatGPT를 만든 OpenAI에 대해서 간략히 알아보는 것으로 세션을 시작했다. 초창기의 OpenAI는 강화학습 분야를 주로 연구하고 있었고, 로켓을 착륙시키는 알고리즘이나 게임에서 높은 점수를 내는 알고리즘을 봤던 기억이 있다. 그 당시의 OpenAI는 오픈소스 진영이었는데 마이크로소프트가 투자한 뒤에 본격적으로 영리를 추구하는 기업으로 변신했다고 한다.
과거의 OpenAI만 기억하던 내 입장에서는 API를 사용하기 위해 비용을 지불해야 한다는 사실에 좀 놀랐었다. 테이블을 보면 알겠지만 저렴하게 사용하려면 gpt-3.5-turbo, 비용이 좀 나오더라도 결과가 중요하다면 GPT-4 모델을 사용하면 된다고 한다. 여기 보면 비용 기준이 토큰으로 나오는데, 실습을 통해서 한국어 문장을 토큰으로 카운트해 보는 예제를 확인해 봤다. (https://github.com/openai/openai-cookbook/blob/main/examples/How_to_count_tokens_with_tiktoken.ipynb)

다음으로 파이썬 노트북을 열어서 chat gpt API를 사용하는 예제를 보면서 API가 어떻게 동작하는지 알 수 있었다. 다시 보기 동영상을 통해서 코드를 직접 실행해 보니 더 기억에 남았다. ChatGPT가 콘텍스트를 어떻게 기억하는지 원리가 궁금했는데 알고보니 주고 받은 대화 내용을 리스트로 보관하고 새로운 질문/응답이 추가될 때마다 리스트에 추가하고 함께 보내는 방식이었다. API 사용 방식을 알고나니 한 대화의 컨텍스트 최대 길이 제한도 이해가 되었다.

다음은 LLM으로 문장을 임베딩하여 사용하는 예시를 봤다. 문장을 임베딩하고 벡터 연산으로 유사한 텍스트를 찾을 수 있다. 예를 들면 지식인에서 유사한 질문들 찾기에 사용해 볼 수 있겠다.

세션 2: 데이터 과학을 위한 chatGPT
첫 번째 세션에서는 ChatGPT API를 사용하는 방법에 대해서 배웠다면 두 번째 세션에서는 프로그래밍을 하지 않고 데이터 사이언티스트가 ChatGPT를 사용해서 어떻게 생산성을 올릴 수 있는지에 대해서 데모를 통해 알아볼 수 있었다. ChatGPT가 코딩할 수 있는 능력이 있는 것은 알고 있다. 하지만 구체적으로 어떻게 프롬프트를 사용해야 원하는 결과를 얻을 수 있는지 고민이 부족했던 것 같다. ChatGPT에 데이터 포맷 예시와 파일 이름을 주니까 라이브러리를 통해서 데이터를 로딩하고, 순식간에 시각화까지 할 수 있었다. 코딩을 직접 할 필요가 없고 에러가 있으면 교정을 해주니까 사람은 '어떻게' 분석할 것인지 고민하는 것에 더 집중할 수 있을 것 같다.
마치며
이번 세미나를 들으면서 2023.04.04 - [Tech] - Microsoft + OpenAI Conference 온라인 참석 후기에서 들었던 말이 생각났다. 스마트폰이 나왔을 때처럼 쓰는 사람과 쓰지 않는 사람 사이에 큰 차이가 발생할 것이고, 이 변화는 돌이킬 수 없다는 뉘앙스로 기억한다. 인공지능을 잘 사용하는 사람들의 사용 예만 봐도 벌써 그런 미래가 그려지고 있다. 콘텐츠 생산도, 코딩도 마찬가지로 생산성에 큰 격차가 발생할 것이다. 그러니까 앞으로 더 적극적으로 활용할 수 있도록 노력하도록 다짐하면서 글을 마친다.
'Tech' 카테고리의 다른 글
구글 Bard 한국어 지원 시작 - 업데이트 소개 및 영문 결과와 비교 (0) | 2023.05.11 |
---|---|
ChatGPT 무료 세미나 & 리소스 (2) | 2023.05.08 |
Google Bard 사용기 & ChatGPT 결과와 비교 (0) | 2023.04.26 |
Spring Webflux에서 Mono.zip() 사용시 주의사항 (ReactorRejectedExecutionException) (0) | 2023.04.25 |
[Kotlin] 코틀린 Sequence 생성 방법, Iterable과 차이점 (0) | 2023.04.17 |