git worktree로 병렬 개발하기: Calyx
왜 병렬 개발이 중요한가? ai가 발전하면서, 몇 년전 인간이 개발하는 동기적인 개발 방식은 이제 가장 비효율적인 방식이 되었습니다. ai 시대, 더 세부적으로는 에이전틱 ai 시대에 맞게, 개발자 또는 빌더들도 개발 방식을 진화시켜야 합니다. 제가 현재 개발하고 있는 Calyx는
12 개의 아티클
A41 제작기 1 : 혼자서 5인 스타트업을 시뮬레이션해보자 CEO, CTO, 디자이너, 마케터, CFO — 혼자서 다 해야 하는 1인 창업자의 운영 문제를 AI 에이전트로 해결하려고 A41을 만들기 시작했습니다. --- 문제: 1인 창업자가 과연 가능한가? 1인 창업가라면, 오전에는
AI 블로그 완성기 6 - 첫 서버 다운.... 정확히 이유를 짐작하기는 어렵지만, 홈서버가 처음으로 다운이 되었습니다... 아마도 블로그에 달아둔 AI 챗봇Qwen3:8B + Ollama이 원인이 된거 같습니다. 멀티턴 대화의 컨텍스트 누적 + 동시 요청 무제한 + GPU 전력 피크가
포트포워딩을 버리고 Cloudflare Tunnel로 갈아탄 이유 홈서버가 다운된 후 복구 과정에서 포트포워딩이 가지는 문제점을 알게 되었고 대안을 찾았습니다. Cloudflare Tunnel로 전환하니 포트포워딩 불필요, 공인 IP 비노출, IP 변경 무관, 무료. 설치부터 syste
TL;DR 포트폴리오 블로그의 RAG 챗봇 응답이 너무 느렸습니다. 병목 분석 결과 Qwen3 thinking 모드, 프론트엔드 인공 딜레이, 매 요청 DB 풀스캔 세 가지가 핵심 원인이었고, 코드 변경만으로 체감 7-19초 → 2-5초로 개선했습니다. 현재 구조 이 블로그의 AI 챗
AI 블로그 완성기4- 챗봇의 컨텍스트 윈도우 확장 Ollama의 기본 컨텍스트 윈도우2,048 토큰를 8,192 토큰으로 확장했습니다. RTX 4070 SUPER의 12GB VRAM 여유분을 활용해서, RAG 검색 결과를 2배 이상 늘리고 응답 품질을 개선한 기록입니다. 문제: 2K
AI 블로그 완성기3 - 전체적인 구조를 보여드립니다 완성기 1편/insights/ai-1에서는 RAG 챗봇의 기획과 구현을, 2편/insights/ai-2에서는 로컬 LLM의 삽질과 회고를 다뤘습니다. 이번 편에서는 조금 다른 관점에서 이야기합니다. "이 블로그는 지금 어떻게 돌아가고
AI FOMO에 대하여 아침에 눈을 뜨면 가장 먼저 하는 일이 있습니다. X를 열어서 밤사이 어떤 AI 뉴스가 나왔는지 확인하는 것입니다. - "GPT-5 출시" - "새로운 오픈소스 모델이 벤치마크 1위" - "Anthropic이 새로운 기능 공개" - "이 스타트업이 AI로 SaaS
Ouroboros가 뭔가요 Ouroboroshttps://github.com/Q00/ouroboros는 Claude Code용 플러그인입니다. 핵심 철학은 생각보다 간단했습니다. "AI 개발이 실패하는 이유는 코드가 아니라 요구사항이 불명확하기 때문이다." 코드를 짜기 전에 "뭘 만들
AI 블로그 완성기2- 삽질의 연속... 이전 편/insights에서는 포트폴리오 블로그에 RAG 챗봇을 기획하고 구현하는 과정을 다뤘습니다. 아키텍처도 깔끔하게 설계했고, 코드도 잘 돌아갔습니다. 문제는 "잘 돌아가는 것"과 "잘 작동하는 것"이 다르다는 걸 깨달은 이후부터였습니다.
AI 블로그 완성기1 - 시작 "방문자가 이 블로그를 통해 나에 대해 빠르게 파악할 수 있을까?" 글을 하나하나 읽어보는 건 시간이 걸립니다. 채용 담당자나 다른 사람들이 방문했을 때, "이 사람은 어떤 프로젝트를 했지?", "어떤 기술 스택을 쓰지?" 같은 질문에 바로 답해줄 수 있
클라우드 API 없이 로컬 LLM 평가 파이프라인 만들기 왜 만들었나 LLM을 평가할 때 보통 GPT-4를 judge로 씁니다. 하지만 매번 API 비용이 들고, 네트워크 상태에 따라 결과가 달라질 수도 있습니다. 로컬에서 모든 걸 완결짓고 싶었습니다. 구조 LLMEval은 YAML