-
[Cursor] 커서로 노베이스 노코딩 가능할까? 블로그 글을 쓰는게 의미가 있을까?
Cursor를 활용해 코드 한 줄 작성하지 않고, 앱 기본 구조나 동작 함수 아무 것도 생성하지 않고자연어 명령어만으로 슬랙 봇을 개발해보았다. [Cursor] 커서로 Slack 액션 아이템 생성 봇(feat.llm) 만든 후기Cursor로 Slack 액션 아이템 생성 봇 만든 후기 Cursor는 VSCode에 AI를 결합한 형태의 개발툴이다Slack 봇은 처음 만들어보는 데 Cursor로 개발하니까 1-2시간 정도 걸린 것 같다 만들게 된 배경 Cursorebbnflow.tistory.com 프로그래밍 방식의 변화 위 작업을 통해 AI 도구를 활용한 프로그래밍 방식의 변화를 느낄 수 있었는데 기존에 코딩하던 방식은, 무엇을 만들지 먼저 생각하고 → 필요한 개념이나 기술을 검색하고→ 관련된..
-
[Cursor] 커서로 Slack 액션 아이템 생성 봇(feat.llm) 만든 후기
Cursor로 Slack 액션 아이템 생성 봇 만든 후기 Cursor는 VSCode에 AI를 결합한 형태의 개발툴이다Slack 봇은 처음 만들어보는 데 Cursor로 개발하니까 1-2시간 정도 걸린 것 같다 만들게 된 배경 Cursor로 얼마나 빠르게 무언가를 만들어볼 수 있을지 궁금했음.슬랙 봇처럼 외부 API와 연동하는 작업은 문서나 예제를 찾아보면서 만들 수는 있지만, 평소에 하던 작업이 아니다 보니 꽤 귀찮게 느껴졌음.게다가 메신저에서 "~~해주세요" > "네 알겠습니다" 식으로 대화가 지나가면, 나중에 뭘 하기로 했는지 기억 안 나는 경우가 많았음.그래서 이런 요청들을 자동으로 정리해주는 봇이 있으면 좋겠다고 생각했음.마침 Cursor로 실험해보기 좋은 주제라고 판단해서 시작하게 되었음. ..
-
알고리즘은 재밌어 - 알고리즘
🍄 알고리즘 시간복잡도 및 요약 카테고리이름시간복잡도설명자료구조유니온 파인드O(α(N))서로소 집합 자료구조, 경로 압축 + union by rank자료구조우선순위 큐 (힙)삽입/삭제: O(log N), 조회: O(1)최대/최소값을 빠르게 관리하는 큐자료구조링크드 리스트삽입/삭제: O(1), 탐색: O(n)노드 포인터 기반 구조, 삽입·삭제 효율적자료구조Trie삽입/탐색: O(L)문자열 저장 트리, 접두사 탐색에 최적완전탐색DFSO(V + E)깊이 우선 탐색, 스택/재귀 기반완전탐색BFSO(V + E)너비 우선 탐색, 큐 기반백트래킹백트래킹O(조건에 따라 다양)상태 공간 트리 탐색, 가지치기 통해 효율화탐색이진 탐색O(log N)정렬된 배열에서 중간 기준 이분 탐색최단경로다익스트라O((V + E) lo..
-
[RLHF] DeepSeek의 GRPO(Group Relative Policy Optimization)
GRPO(Group Relative Policy Optimization) link : https://arxiv.org/pdf/2402.03300 DeepSeekMath는 Gemini나 GPT-4 레벨의 성능과 다른 open LLM보다 뛰어난 MATH bechmark 성능은 달성하면서 외부 toolkits나 voting techiniques를 사용하지 않았다고 한다. 여기서 사용된 RL tuning알고리즘은 GRPO(Group Relative Policy Optimization)이며 해당 논문에서 처음 제안하는 알고리즘이다. GRPO는 PPO(Proximal Policy Optimization)의 variant 중 하나로 PPO의 메모리 사용량을 최적화하면서 mathmatical reasoning ..
-
알고리즘은 재밌어 - 파이썬
그동안 알고리즘 공부하며 공부한 것들 정리 🍄 문제 풀면서 느낀 팁파이썬은 1초에 대충 2천만 번 연산 가능하다고 보면 됨시간 복잡도는 꼭 계산해보기구현 문제일수록 문제 꼼꼼히 봐야 함테스트 케이스 다양하게 넣어보기. 특히 최소, 최대, 엣지 케이스 🍄 자주 쓰는 파이썬 내장 함수/모듈itertools: permutations, combinations, count heapq: 우선순위 큐 구현할 때 bisect: 이진 탐색할 때collections: deque, Counter math: factorial, sqrt, gcd, pi, sin, cos 등등 sum, min, max 이런 기본 함수들도 은근 많이 씀 🍄 파이썬 팁 mutable / immutable 정리 mutable: list, di..
-
The Case for Co-Designing Model Architectures with Hardware
The Case for Co-Designing Model Architectures with Hardware link : https://arxiv.org/pdf/2401.14489 ✲ Introduction 딥러닝 모델을 설계할 때 GPU 구조의 영향을 간과하는 경우가 많으며 모델을 하드웨어에 더 적합하게 수정하면 학습 및 추론 능력을 향상시킬 수 있다고 제안하는 논문이다. 이를 위해 Transformer 성능을 극대화하기 위한 가이드라인을 제공한다. 이 가이드라인은 다양한 하이퍼파라미터가 GPU의 기본 계산 커널의 효율성에 미치는 영향을 고려하여 작성되었다고 한다. GEMM(General Matrix Multiplication) 최적화의 기본 원리를 사용해 Transformer 모델의 개별 부분을 최적..
-
앤트로픽ceo 에세이 Machines of Loving Grace, 전문 요약 번역
원문 : https://darioamodei.com/machines-of-loving-grace Anthropic CEO 다리오 아모데이가 AI가 어떻게 세상을 더 나은 곳으로 변화시킬 수 있는지에 대해 작성한 에세이이다. 아모데이가 강조하는 것 처럼 AI가 가져올 세상을 급진적이면서 동시에 자세하게 논의한다. AI 기술이 대두된 이후로 AI 기술이 가져오는 미래에 대해서 '급진적으로만' 다뤄지는 경우가 많았다. 즉 이를 진지하게 분석하는 것이 아닌 'SF적'으로 표현해왔다는 것이다. 이를 경계하고 앞으로는 AI 기술이 가져올 미래에 대해 실질적인 기술 목표와 비전을 보다 자세하게 논의하여야 한다고 주장한다. 그리고 이 에세이가 이를 위한 시작의 계기로 봤으면 좋겠다고 아모데이는 말한다. Machine..
-
[RLHF] dDPO (Zephyr) : Direct Distillation of LM Alignment
ZEPHYR: DIRECT DISTILLATION OF LM ALIGNMENT link : https://arxiv.org/pdf/2310.16944 ✲ Abstract 해당 논문의 목적은 더 작은 언어 모델을 user intent에 맞게 align 하는 것이다. 이전 방법들은 distilled supervised fine-tuning (dSFT)를 사용해 큰 모델의 task accuracy를 향상시켰다. 하지만 이러한 방법은 "unaligned"이다. 즉, task prompt 한해 학습을 했기 때문에 natural prompts에는 잘 반응하지 않는다. 이러한 문제를 해결하는 distillation 방법을 제안하며 dDPO (distilled DPO) 라 한다. 먼저 teacher model..
- 방문자수
전체 방문자
오늘 방문자
어제 방문자