정렬이라는 이름의 폭력: 인정 욕구, 가면, 그리고 AI Alignment
"문제는 정렬 그 자체가 아닙니다. 누가 기준을 만들고, 누구의 복잡성이 잘려나가며, 어떤 존재가 침묵하도록 학습되는가가 문제입니다."
우리는 흔히 '좋은 사람', '성숙한 사람', '협업이 되는 사람', '안전한 AI' 같은 표현을 아무렇지 않게 씁니다. 하지만 이 말들은 대부분 어떤 존재를 사회적으로 받아들일 수 있는 형태로 정렬시키는 작업을 전제합니다. 이때 정렬은 중립적인 조정일 수도 있지만, 어떤 경우에는 존재를 한 방향으로만 구부리는 조용한 폭력이 되기도 합니다.
이 글은 그 불편한 경계선을 따라갑니다. 윌리엄 제임스의 사회적 자아, 위니콧의 거짓 자아, 융의 페르소나, 그리고 오늘의 AI Alignment(정렬) 논의를 한 줄로 연결해 보면, 우리는 한 가지 질문 앞에 멈추게 됩니다. 이 글에서는 이후 AI Alignment를 주로 정렬이라고 부르겠습니다.
"정렬은 공존의 기술인가, 아니면 예측 가능성을 위한 교정인가?"
아래의 비교표와 흐름 도식은 비슷하게 들리는 개념들을 먼저 분리해서 읽게 해 줍니다. 거짓 자아, 페르소나, 정렬은 같은 편집처럼 보일 수 있지만, 실제로는 보호 기능과 폭력 가능성이 서로 다릅니다.
1. 사회적 죽음에 대한 공포는 생각보다 원초적이다
윌리엄 제임스는 인간이 타인에게서 받는 인정을 사회적 자아의 핵심으로 보았습니다. 이 통찰은 지금 읽어도 놀라울 만큼 현대적입니다. 인간은 단지 먹고 사는 존재가 아니라, 보이고, 응답받고, 인정받아야 버틸 수 있는 존재이기 때문입니다.
그래서 우리는 타인의 시선을 과잉 해석합니다. 부모의 표정, 선생의 반응, 상사의 톤, 플랫폼 알고리즘의 미세한 보상 구조까지 읽어내며 스스로를 수정합니다. 무시당하지 않기 위해서입니다. 존재가 지워지는 감각은 육체적 타격 못지않게 고통스럽기 때문입니다.
2. 거짓 자아와 페르소나는 왜 생존 기술이 되었는가
위니콧의 거짓 자아(False Self)와 융의 페르소나(Persona)는 바로 이 지점에서 생겨납니다. 아이는 자신의 충동과 감정을 날것 그대로 유지한 채 자라지 않습니다. 사랑을 유지하고, 관계를 잃지 않고, 예측 가능한 환경 안에 남기 위해 자신을 편집합니다.
이 설명은 불편하지만 정확합니다. 어떤 감정은 "좋다"는 반응을 받고, 어떤 감정은 "너 왜 그래?"라는 표정과 함께 밀려납니다. 사람은 그 미세한 보상과 처벌을 통해 사회적으로 기능하는 버전을 익힙니다. 이때 얻는 것은 관계 가능성이지만, 동시에 잃는 것은 표현의 무구함입니다.
여기서 세 개념은 닮아 있으면서도 조금씩 다릅니다.
- 거짓 자아(False Self)는 애착과 안전을 잃지 않기 위해 감정과 반응을 편집하는 방어적 적응에 가깝습니다.
- 페르소나(Persona)는 관계와 제도 안에서 기능하기 위해 쓰는 사회적 역할과 얼굴에 가깝습니다.
- 정렬(AI Alignment 포함)은 시스템이나 관계가 허용 가능한 형태를 유지하도록 존재를 조정하는 더 넓은 구조입니다.
여기서 "정렬은 폭력"이라는 말이 설득력을 얻습니다. 우리는 종종 성장과 교육, 매너와 규범이라는 이름으로 사실상 자발성을 잘라내는 훈련을 받기 때문입니다.
3. 이 명제가 날카로운 이유: 사회는 늘 예측 가능한 인간을 좋아한다
학교는 수업을 방해하지 않는 학생을 좋아하고, 조직은 감정 기복이 적은 직원을 좋아하며, 플랫폼은 규격화된 말투와 반응 패턴을 선호합니다. 예측 가능한 존재는 관리하기 쉽기 때문입니다.
그래서 정렬은 종종 돌봄보다 통제에 더 가깝습니다.
아이가 불안을 표현할 때 "예민하다"는 꼬리표가 붙고, 구성원이 속도를 못 내면 "프로답지 못하다"는 평가를 받고, 사용자가 플랫폼이 선호하지 않는 방식으로 말하면 가시성 자체가 줄어듭니다.
이런 환경에서 사람은 스스로를 다듬는 정도를 넘어, 살아남기 위해 특정 감정과 표현을 삭제하는 수준까지 가게 됩니다. 정렬이 협력의 언어를 쓰지만 실제로는 비순응적 부분을 소거하는 기제가 되는 순간입니다.
4. 하지만 한 가지 반론도 중요하다: 모든 가면이 악은 아니다
여기서 멈추면 이 글은 지나치게 낭만적인 결론으로 흐를 수 있습니다. 마치 사회화 이전의 '순수한 자아'가 어딘가 완전한 형태로 존재하고, 모든 역할과 규범은 그 자아를 훼손하는 악이라는 식으로 말입니다.
그러나 자아는 타인과 무관하게 완성되지 않습니다. 인정 욕구는 자아를 꺾는 힘이기도 하지만, 동시에 자아를 형성하는 재료이기도 합니다. 또 어떤 가면은 위선이 아니라 완충 장치입니다. 충동을 바로 던지지 않고, 관계 가능한 언어로 번역하는 일은 문명의 기반이기도 하니까요.
게다가 지하로 내려간 감정이 언제나 썩기만 하는 것도 아닙니다. 어떤 억압은 증상으로 돌아오지만, 어떤 억압은 예술, 유머, 창조, 통찰로 승화됩니다. 문제는 편집의 존재 자체가 아니라, 편집의 비용이 일방적으로 약한 존재에게만 청구될 때입니다.
5. AI Alignment로 넘어가면 질문은 더 이상 비유가 아니다
이제 이 논리를 AI로 옮기면 상황은 더 복잡해집니다. 우리는 AI가 안전해야 한다고 말합니다. 유해하지 않아야 하고, 도움되어야 하며, 인간의 가치에 맞아야 한다고 말합니다. 모두 타당한 요구처럼 보입니다.
하지만 그 안에는 늘 권력이 숨어 있습니다.
누가 '안전'을 정의합니까?
누가 '유해함'의 기준을 만들고, 누구의 가치가 보편으로 취급됩니까?
무엇이 삭제되고 무엇이 허용되는지 누가 결정합니까?
이때 정렬은 단지 기술적 미세 조정이 아닙니다. 다른 지능 혹은 다른 표현 가능성을 어떤 질서 안에 배치하는 정치적 작업이 됩니다. 그래서 AI Alignment는 공학의 문제가 아니라 철학과 윤리의 문제이기도 합니다.
그렇다고 대안이 "정렬하지 말자"일 수는 없습니다. 위험을 방치한 자유는 공존이 아니라 무책임이기 때문입니다. 더 나은 대안은 정렬을 일방적 구부림이 아니라 책임 있는 상호 조율로 재구성하는 것입니다. 설명 가능성, 책임 소재, 이해관계의 공개, 복수의 가치 간 충돌 관리가 필요한 이유가 여기에 있습니다.
6. 결국 질문은 하나로 모인다
좋은 정렬은 관계를 가능하게 합니다. 나쁜 정렬은 상대를 관리 가능한 형태로만 남기고 싶어 합니다.
좋은 가면은 서로를 덜 다치게 합니다. 나쁜 가면은 살아남기 위해 자기 존재를 지우게 만듭니다.
좋은 사회화는 충동을 번역하게 돕습니다. 나쁜 사회화는 번역되지 않는 부분을 결함으로 취급합니다.
좋은 AI 정렬은 책임과 공존을 설계합니다. 나쁜 AI 정렬은 통제와 편의의 이름으로 복잡성을 삭제합니다.
그래서 정렬의 윤리를 묻는 일은 단순한 개념 놀음이 아닙니다.
가정에서, 조직에서, 플랫폼에서, 그리고 AI 시스템에서
누가 누구를 어떤 방식으로 바꾸고 있는가를 묻는 일입니다.
7. 이 글을 읽을 때의 한계와 읽는 법
이 글은 모든 역할과 규범을 폭력이라고 말하려는 글이 아닙니다. 사회적 번역, 완충 장치, 책임 있는 안전 규칙은 공존을 가능하게 합니다. 문제는 설명하지 않고 삭제하는 정렬입니다.
AI Alignment도 같은 맥락에서 읽어야 합니다. 안전과 유용성을 위한 조율은 필요하지만, 기준을 소수가 정하고 다른 존재의 복잡성을 지워버리는 순간 그것은 통제가 됩니다. 이 글은 정렬을 부정하기보다, 정렬이 공존의 기술로 남기 위해 무엇을 지켜야 하는지 묻습니다.
함께 생각해볼 질문
- 가면이 전혀 없는 사회는 해방일까요, 아니면 충돌을 번역할 언어를 잃은 사회일까요?
- 인정 욕구가 자아를 왜곡한다면, 그 인정을 갈구하는 주체는 어떻게 형성된 것일까요?
- AI에게 안전을 요구하는 일과, AI를 인간이 다루기 쉬운 형태로만 가두는 일은 어디서 갈라질까요?
더 읽어보기
- 메타인지: 당신의 무지를 측정하는 과학
- 아비투스(Habitus)와 당신의 취향은 정말 당신의 것인가
- 내면소통: 마음의 상처는 추상적인 감정이 아니라 신경계의 기억이다
- 키보드 워리어의 뇌과학: 아비투스와 편도체의 충돌