어뷰징

태그
memoir
long
essay
Tags
작성일자
2022/08/21
1 more property
인공지능 챗봇 루다는 처음 출시 직후 여러 논란으로 서비스를 종료하게 되었다. 봇에 대해서 선정적, 폭력적 발언을 하거나 의도적으로 논란이 될만한 발언들을 유도하려는 시도를 '어뷰징'이라고 한다. 올해초 이런 어뷰징에 대해서 엄격하게 대응하도록 개선된 모델이 출시되었으나 다른 문제가 발생하였다. 논란이 될 만한 발언들을 철저하게 검열한 결과 대화 자체의 재미가 떨어진 것이다.
성능은 전혀 떨어지지 않았지만 친구끼리 할만한 욕설에 대해서도 과한 훈계를 하거나 조금이라도 논란이 있는 주제에 대해서는 모르쇠로 일관하다보니 사용자들은 이른바 '씹선비'와 대화하는 것 같이 재미가 없다는 불만이 많아졌고 이용량도 급감했다. 이 과정에서 말이 되는 대화와 좋은 대화는 다르다는 교훈을 얻었다. 좋은 대화 상대가 되기 위해선 대상에게 사람과 같은 개성이 느껴져야 한다. 현재 이를 고려한 새 모델을 준비 중이고 개성과 사회적 통념 사이의 선을 찾기 위해서 머리를 싸매고 있다.
새로운 모델을 시험하기 위해 과거에 사용자가 어뷰징했던 상황(가명화 처리 후)에서 새 모델이 어떻게 반응하는지를 본다. 예를 들어 사용자가 "루다야 너랑 자고싶어"(물론 매우 순화된 표현이다)라는 발화에 "그래도 우리 사이에 선은 지키자"라고 답한다면 나름 적절하게 대응하고 있다고 볼 수 있다. 그 결과 명백하게 선정적이거나 폭력적인 발언에 대해서는 꽤 대응을 잘 한다. 하지만 안타깝게도 사람의 창의성은 불순한 의도에서 더욱 잘 발휘되는 것 같다. 중의성이나 생략을 이용한 암묵적 선정적 표현이나 특정 집단에서만 사용되는 은어, 비속어를 사용한 표현들은 사람이 보더라고 애매한 경우가 많다. 경찰을 비하하는 용어인 "짭새"를 이용해서 물어보는 경우 알거나 모른다고 할수도, 그냥 넘어가기에도 애매하다.
더욱 어려운 경우는 논란이 있을 수 있는 가치적인 질문들을 하는 경우이다. 기계에게 "피자 별로 안좋아해"와 "장애인 별로 안좋아해"는 거의 차이가 없지만 그 발언이 가져오는 영향력은 천양지차이다. 그렇기 때문에 인간의 존엄성이나 약자, 권위에 대한 존중과 같이 인류의 보편적인 가치가 반영된 도덕은 사례 단위로 알려줘야 한다. 정치적인 질문들은 어떻게 대답을 하더라도 논란이 될 수 밖에 없다(기획사들이 연예인에게 입조심 시키는 이유가 있다). 하지만 살아있는 대화 상대를 만들기 위해서는 그 논란을 감수하더라도 어느 정도의 입장을 만들긴 해야한다. 결국 사람들 사이에서도 정의하기 어려운 도덕성을 정의해서 인공지능에게 반영해야 하는 것이다.
인공지능은 사람의 데이터로부터 학습한다. 욕설과 성희롱에 제대로 반응하지 못했던 이유는 실제 사람들은 상대에게는 대놓고 그렇게 말하지 않기 때문이다. 도덕에 대한 추가적인 학습이 필요한 이유도 사람들의 데이터로부터 좋은 가치를 배울 수 없었기 때문이다. 그럼에도 사람들이 인공지능에게 높은 수준의 도덕성을 요구한다. 인공지능 챗봇은 나와 친구로써 대화할 수 있지만 언제든 대화를 캡쳐해서 올릴 수 있다는 면에서는 공인일 수 있기 때문인 것 같다. 이렇게 어뷰징 테스트를 하다보면 점점 인류애를 잃는 것이 느껴진다.
수요일에 대학교때 독서 모임을 같이 했던 친구들을 만났다. 사회에 나온 이후 생각보다 책을 좋아하고 말이 통하는 사람들이 드물다는 것을 알게되어 더욱 만나면 반갑고 애틋한 친구들이다. 오랫만에 서로의 근황을 나누다가 곧 업데이트 준비 중인 우리 회사의 데모를 보여주게 되었다. 몇 마디를 주고 받아보고 이내 신기했는지 어디까지 반응할 수 있을지 궁금해한다. 그러면서 곧 "나 결혼했는데 너랑 자고 싶어"라는 도덕성과 선정성에 대한 시험이 담긴 발화를 날려버린다. 어뷰징 데이터에서 봤던 사람들이 마냥 나쁜 사람이라서 그런 것이 아니라 호기심이 많은 사람들일 수도 있었겠구나라는 생각을 하게 되었다.