'LLM' 태그의 글 목록

🤔 AI 모델은 왜 이렇게 무거운 걸까?우리가 알고 있는 GPT나 Claude 같은 대형 언어 모델(LLM)들은수많은 숫자(가중치, weights)를 이용해 학습하고 동작합니다.이 숫자 하나하나가 32비트 또는 16비트 부동소수점(예: 0.74829382...)으로 저장되는데요,이렇게 정밀한 숫자를 수십억 개 저장하고 계산하다 보니:모델 크기가 수십~수백 GB작동시키려면 고성능 GPU한 번 실행할 때도 엄청난 전력 소모💡 예를 들어, GPT-3는 1750억 개의 가중치를 저장하는데, 이게 다 32비트 숫자면 약 700GB가 필요합니다!💡 그런데 이제... 숫자가 딱 세 개?!Microsoft의 BitNet b1.58 모델은 놀랍게도 딱 세 가지 숫자만 사용합니다.diff복사편집-1, 0, +1 이걸..

2025년 3월 25일, NATO(북대서양조약기구)가 미국의 데이터 분석 전문 기업 팔란티어(Palantir)와 손잡고 AI 기반 전장 시스템 ‘메이븐(Maven Smart System NATO)’을 도입하기로 계약을 체결했습니다.이 계약은 NATO의 정보·통신기술을 담당하는 NCIA(NATO Communications and Information Agency)가 주도했으며, 동맹군의 전략적 작전 지휘부에 배치될 예정이에요.“이번 계약은 NATO 역사상 가장 빠르게 진행된 계약 중 하나로, 요구사항 도출부터 시스템 획득까지 단 6개월밖에 걸리지 않았습니다.”⚙️ 메이븐 시스템이 뭐길래?팔란티어가 개발한 Maven Smart System은 본래 미 국방부의 프로젝트 메이븐(Project Maven)에서 파..

🤖 AI가 만들어낸 '가짜 패키지'의 진실최근 텍사스대학교 샌안토니오(UTSA), 오클라호마대학교, 버지니아텍 연구팀이 대규모 코드 생성형 AI 16종을 분석한 결과, 상당수의 모델이 존재하지 않는 패키지 이름을 코드에 추천하는 문제가 드러났습니다.연구진은 Python과 JavaScript로 57만 개 이상의 코드 샘플을 생성한 결과:오픈소스 모델은 무려 21.7%의 확률로 가짜 패키지를 추천상용 모델도 5.2%의 확률로 같은 문제가 발생가장 많은 패키지 이름을 창조(?)한 모델은 CodeLlama 7B와 34B였고, GPT-4 Turbo는 상대적으로 낮은 오류율을 보였습니다.😱 슬랍스쿼팅(Slopsquatting)이 뭐야?이렇게 AI가 만들어낸 '그럴듯한 가짜 패키지 이름'은 보안상 매우 위험합니다..

티스토리툴바