트위터 추천 알고리즘 공개, GitHub에서 오픈 소스를 확인할 수 있습니다.
알려지지 않은 사용자가 트위터 소스코드의 일부를 GitHub에 게시한 후에 알고리즘이 공개되었습니다.
트위터 추천 알고리즘
대중과 소셜 미디어 플랫폼 간의 투명성을 높이기 위한 노력으로 CEO 일론 머스크는 트위터의 추천 알고리즘을 오픈 소스로 만들어버렸습니다. 머스크는 그의 말에 충실한 것으로 보이며 실제로 GitHub에 트위터의 추천 알고리즘을 공개했으며 트위터팀에서 코드 알고리즘이 실제로 트위터의 블로그에서 무엇을 하는지 설명하는 글을 게시했습니다. 트위터는 핵심적으로 트윗을 추천하는 알고리즘("홈 믹서"라고 함)이 "후보 소싱"이라는 프로세스를 사용하여 트윗을 소스에서 가져와서 머신 러닝 모델과 비교하여 순위를 매긴 다음 차단한 사용자 및 콘텐츠가 NSFW인 경우와 같은 벤치마크를 기준으로 필터링한다고 주장합니다. (*NSFW: Not safe for work)
GitHub - twitter/the-algorithm: Source code for Twitter's Recommendation Algorithm
Source code for Twitter's Recommendation Algorithm - GitHub - twitter/the-algorithm: Source code for Twitter's Recommendation Algorithm
github.com
트위터는 홈 믹서 후보 소스가 팔로우하는 사람과 팔로우하지 않는 사람 모두로 구성되어 있으며 For You 탭은 보통 각각 50%의 트윗으로 구성되어 있다고 말합니다. 홈 믹서는 이 첫 단계에서 약 1,500개의 트윗을 가져옵니다. 이 알고리즘은 트윗의 순위를 매길 때 트윗의 출처가 무엇인지 무시하고 10개의 레이블 중 하나를 할당하기 위해 "수천 개의 기능을 고려"합니다. 각 레이블은 특정 참여 확률에 해당합니다. 그런 다음 홈 믹서는 자체 내부 체를 기준으로 트윗을 필터링한 다음 For You 페이지에 던집니다.
머스크는 이전에 트위터가 사용자에게 트윗을 추천하는 데 사용하는 알고리즘이 사용자에게 코드 투명성을 제공하여 신뢰로 이어질 수 있도록 3월 31일에 오픈소스가 될 것이라고 발표했습니다. 대다수의 트위터 사용자들이 코드에 대해 더 많은 것을 배우는 데 관심이 있는지는 아직 알 수 없습니다. 그럼에도 불구하고, 머스크 트위터가 알고리즘을 미세하게 조정하는 방법을 계속 찾고 있기 때문에 코드 투명성을 제공하는 것이 "처음에는 매우 당황스러울 것"이라는 것을 인정했습니다
"우리의 '알고리즘'은 지나치게 복잡하고 내부적으로 완전히 이해되지 않습니다. 사람들은 어리석은 것들을 많이 발견하겠지만, 문제가 발견되는 대로 바로 수정할 것입니다!" , "우리는 더 매력적인 트윗을 제공하기 위해 단순화된 접근 방식을 개발하고 있지만, 여전히 진행 중입니다. 또한 오픈 소스가 될 것입니다." 머스크의 3월 초 트윗입니다.
공개되지 않은 것으로 보이는 한 가지는 트위터가 사용자를 밀어주는 VIP 목록입니다. 내부 이메일에 따르면, 플랫포머는 트위터가 알렉산드리아 오카시오-코르테즈 하원의원부터 유튜버 미스터 비스트, 데일리 와이어 창업자 벤 샤피로에 이르기까지 모두를 포함한 리스트를 가지고 있다고 보고했습니다. 트위터는 이 목록을 사용하여 파워 유저들의 가시성을 마음대로 높여 웹사이트의 추천 알고리즘 변경 사항을 모니터링한다고 합니다. 이 목록은 모든 사람을 평등하게 대하려는 일론 머스크의 생각과 극명한 대조를 이룹니다.
트위터 코드의 일부는 사실 이미 오픈 소스로 만들어졌습니다(머스크가 계획했던 방식과는 다른). 법원 문서에 따르면 트위터의 소스 코드 일부가 GitHub에 업로드되었다는 소식이 전해졌습니다. 법원 문서에서 트위터는 위반 코드 부분을 온라인 저장소에서 제거할 것을 요구했습니다. 트위터는 또한 GitHub에 DMCA 저작권 침해 신고를 제출하여 코드를 제거하도록 요청했고 이에 따라 해당 코드는 삭제되었습니다.
뉴욕 타임즈는 몇 달이 될 수도 있었다고 보도했지만, 얼마나 많은 코드가 업로드되었는지 또는 얼마나 오랫동안 온라인에 남겨졌는지는 확실하지 않습니다. 소스 코드 덩어리는 "FreeSpeechEnthist"로 불리는 사용자에 의해 업로드되었습니다. 아마도 "FreeSpeechAbsolutist"가 되려는 머스크의 잘못된 시도에 대해 고개를 끄덕이는 것 같습니다. 그러나 트위터가 해커의 정체를 밝히기 위한 소환장을 성공적으로 얻었기 때문에 "FreeSpeechEnthist"가 누구든 곧 밝혀질 수 있습니다. 또한 소환장은 GitHub가 코드가 업로드된 동안 코드를 다운로드한 사람에 대한 신원 및 정보를 트위터에 제공해야 한다고 요구하고 있습니다.