투디갤 - AI - 로컬 발전이랑 nai랑 관계 있나?

2024.04.16 20:30

ㅇㅇ

뭔소린지 모르겠는데 로컬모델을 쓰는 프론트엔드가 아닌걸
메타의 Llama가 모든 로컬 (추정상 nai도) 모델의 기반인데 다음주인가 llama 3이 발표되고 이거 기반으로 또 성능 상승된 모델들 나올거임
이더룸은 좀 별개긴 함 모델 정보도 안나오긴 했는데 무검열+ RP용 사이트+자체개발 모델은 없었으니 (기존의 다른 nsfw챗봇 사이트들은 무료로 허깅에 풀린 모델을 가져와서 장사하는 것) 뭐 그 접근성이라는게 개인적으론 cai가 채찍 다음으로 ai관련 이용자수 보유하고 있는 거 보면 크다고 생각하긴 함
아무튼 나는 로컬 Nai 둘 다 쓰는데 나름 장단점이 있음 일단 로컬은 존나 키는게 귀찮음 Nai는 엄청편함 그리고 챗봇/소설에서 강점이 조금씩 다르고 여전히 문체는 Nai가 엄청 취향인 듯

[Code: f91e]

2024.04.16 20:32

ㅇㅇ

이더룸도 보면 간편함이 제일 큰 강점이 아닐까 싶음 그리고 무검열 모델에 봇 서칭이 가능한 것도 (실리 쓰면서 느낀게 그냥 아무봇 바로 골라서 쓸 수 없는게 귀찮음)

[Code: f91e]

2024.04.16 21:06

ㅇㅇ

ㄱㅆ 와 나깡은 진짜 존나 알못이었노 알려줘서 ㄱㅅㄱㅅ 몇 가지만 더 물어봐도 되냐 그럼 nai은 (추정상)Llama 13b 모델을 기반으로 소설 데이터를 학습 시켜서 만든 로컬 모델이라고 보면 되는 거임? Nai가 13b에 머물러 있는 건 그럼 (라마2를 기반으로 한다고 추정할 때)라마2에서 34b를 지원하지 않고 70b를 쓰기엔 너무 높은 사양의 GPU를 필요로 하니까 무리인 거라고 생각하면 되는 건가. 물론 정확한 고스펨보이가 아닌 이상 알 수 없지만 예상한다고 할 때 ㅇㅇ

[Code: b58a]

2024.04.16 21:24

ㅇㅇ

Nai는 라마기반 모델들이랑 돌아가는게 다른거 보면 라마 2가 오픈소스로 논문 및 튜닝, 학습법 등 다 풀었는데 그걸 기반으로 만들었다고 추측하더라고 그니까 노하우만 참고?
실제로 그당시 나온 라마 기반 모델들 성능은 진짜 구렸음
추가 모델이 안나오는건 뭐 정황상 이미지 모델 7월 ~11월, 그 이후 쭉 이더룸 투자라 보는게 맞을듯 어쨌든 라마 3나오고 동향보면 됨

[Code: 1046]

2024.04.16 21:29

ㅇㅇ

ㄱㅆ 알려줘서 고맙다 너깡 코드 오늘 날짜 숫자 조합됐노 복 받으셈 ㄱㅅㄱㅅ

[Code: b58a]

2024.04.16 22:24

ㅇㅇ

추정 아니고 인터뷰에서 사장이 밝혔음 그때 알파고 만든 구글의 딥마인드라는데에서 친칠라라는 llm 만들었음
거기서 논문도 같이 냈는데 거기서 훈련 최적화 방식 이런것도 같이 공개했다고 함 그거보고 참조한거라함
기존 모델들은 추론을 위해서 과하게 학습시킨다고 함 nai는 그걸 쳐내고 압축시켜서 핵심만 학습시킨거고
(내 생각엔 아마 자기들은 소설이니까 그 외에 불필요한 학술 데이터는 학습 안시킨듯)
그래서 적은 파라미터로도 좋은 효율을 낼 수 있다고 함

카이라도 시기상 봤을때 라마1이 오픈소스라 그거 보고 참고해서 13b까지 끌어올렸을 가능성이 큼
얘네가 아예 제로에서 모델을 만들 능력은 없는거임 그래서 기반이 될 참고할 노하우가 있어야 하는데 라마에서 13b와 70b의 중간을 안내줘서 못하는거 같음 물론 여기에 서비스 가능하냐의 문제도 있긴 할거임

[Code: 6432]

2024.04.16 22:26

ㅇㅇ

라마도 기본으로 1조 4천 토큰 훈련 데이터가 있는데 nai는 본인들이 1조 6천 토큰 데이터가 있다고 함
라마는 다른 oai나 클로드 같이 어시용이라 학술 데이터 위주인데 nai는 이게 다 소설 관련 데이터 위주일거임 그래서 질적인 차이가 나는거 같음

라마3 나오면 일단 성능 자체도 업글되는거라 nai도 관련 노하우 보고 만들면 성능 향상할 가능성이 있지
윗댓처럼 일단 지켜봐야함 ㅋㅋㅋ 라마3가 어느정도 크기로 나올지 모르는거라

[Code: 6432]

2024.04.16 23:25

ㅇㅇ

ㄱㅆ 오 알려줘서 고맙다 혼자서 ㅈㄴ 궁금해 했는데 속이 다 시원하노 혹시 얘네가 오픈 소스 없이 제로부터 모델을 만들 수 없는 이유가 뭐라고 생각함? 학습시킬 데이터는 있는데 기반이 없어서 못한다는 게 정확히 무슨 뜻인지 궁금하네 검색해보고 있는데 다 학습시키는 방법만 나와서 물어봄

[Code: 8b5b]

2024.04.16 23:30

ㅇㅇ

아무래도 기업 규모가 작으니까? 지금도 대기업들 나서서 모델 만들어도 oai 절대 못따라잡잖음
언어모델을 제로부터 구축해서 만든다는게 쉬운게 아니기도 하고 돈, 시간, 그리고 기업적 입장에서 생각해봤을때 nai에서는 그렇게 할 이유가 없을거임
안에 넣을 데이터 예를 들어 소설, 아오삼 글들 이 내용물은 있는데 막상 끼울 틀이 없는거지
그렇다고 틀을 처음부터 만들기엔 시행착오도 겪어야하고 돈, 시간 다 써야하는 도박이니까 그냥 라마 같은 남들이 만든 틀 보고 따라 만들어서 자기들 내용물 끼우는게 더 나을거임

[Code: 2e79]

2024.04.16 23:33

ㅇㅇ

그냥 ai 만드는데도 돈이 엄청 드니까 아무래도 돈 문제가 제일 클거같음
예를 들어 ai 사업 뛰어든 것도 구글, 마소 같은 원래 대기업인 곳이나 아마존 같은데서 돈 몇 억씩 후원받는 클로드니까...
nai는 후원도 못받고 구독제 + 안라스 충전이 자금이니까 그러는건 손해일거임

[Code: 2e79]

2024.04.16 23:40

ㅇㅇ

ㄱㅆ 나깡 평생 사이다 안먹어도 되겠노 알려줘서 ㄳㄳ 복 받아라

[Code: 8b5b]