AI & Society·2021-05-22

당근마켓이 신고 예측을 풀 수 있었던 이유

당근마켓 데이터센트릭 사례다. 당근마켓에 등록된 글이 신고받을지 여부를 미리 예측하는 모델을 소개했다.

모집단이 급속도로 확장되는 경우 수작업 레이블 데이터만으로 이를 커버하는 모델을 만들기 어렵기에, 사용자 신고와 운영자 제재 데이터를 직접적인 학습 데이터로 이용했다는 것이다.

이것이 가능했던 핵심적 이유는 실제로 유해한지를 예측하는 것이 아니라 사용자가 신고할지 말지 그 자체를 예측 목표로 삼았기 때문이다. 만약 실제 유해성을 구분하고자 했다면 사용자 신고 데이터를 활용하는 것은 훨씬 어려운 작업이었을 것이다.

Online learning 방식이 아닌 파인튜닝에 이 데이터를 활용한 것으로 보인다.

ai-productservice-review

핫한 AI 서비스를 찾는 법

핫한 AI 서비스를 찾기 위한 여러 방법을 시도한 끝에 발견한 toolify.ai. 56개 카테고리 분류, 방문자 데이터, 성장률 순위 등이 잘 갖춰진 사이트다.

페이스북은 광고의 탈을 쓴 광고다

페이스북 피드의 광고와 비광고 추천이 도를 넘어 10개 중 7개가 보고 싶지 않은 글이다. 의도적으로 불편하게 설계된 대안 피드까지, 남은 가치를 짜내는 모습이다.

OpenAI DevDay: 불편 사항 전부 해결

OpenAI DevDay에서 API 사용자의 불편 사항을 대부분 해결한 업데이트를 분석한다. 시장 핏을 넘어 'OpenAI 핏'을 고민해야 하는 시대의 도래와 스타트업 생태계에 미치는 영향을 짚는다.

Comments (0)

Markdown supported