AI가 가짜 계정을 식별하는 데 도움이
가짜 계정 (봇, sibylls, 구매 한 "슈퍼 차저", 회색 농장) 은 신뢰에 해를 끼치고 지표를 왜곡하며 사기 위험을 증가시킵니다. AI를 사용하면 개인 데이터에 침입하지 않고 책임있는 게임을 관찰하지 않고 행동, 컨텐츠 및 네트워크 신호를 조합하여 탐지 할 수 있습니다.
1) AI가 가짜를 구별하는 신호
행동 (반복 가능한 패턴)
비정상적인 동작 빈도 (일시 중지가 최소 인 일련의 반응/메시지).
온 보딩없이 "콜드 스타트": 프레젠테이션, 규칙 읽기, 즉시 질문 프로모션.
선언 된 지역에 대한 비정형 활동 시간대, 다른 계정과 동기화.
제로 "사회적 관성": 많은 발신, 들어오는 응답; 건설적인 메시지의 역사는 없습니다.
내용
공식 문구/어휘, 낮은 독창성, 동일한 텍스트의 반복.
참조 패턴: 낮은 평판 도메인, IM 템플릿, 추적 꼬리.
문맥이없는 독성, "프라이밍" 갈등, 논란의 여지가있는 의제.
네트워크 (그래프)
고밀도 "별" 및 "반지": 많은 새로운 계정이 1-2 노드에 연결되어 있습니다.
"다른" 프로파일에 대한 비정상적으로 높은 공유 이웃.
동일한 참여 경로: 누가 누가 순서대로 다시 게시합니까 (캐스케이드 지문).
기술/운영
개인 정보 보호 및 법률에 따라 비정상적인 환경 지문 (브라우저/장치).
쿠키/로컬 상태의 빈번한 재설정, 동일한 유형의 사용자 에이전트.
채팅/소셜 네트워크에서-추첨/추천 지점에만 참여합니다.
2) 프라이버시 침해없는 파이프 라인 데이터
1. 수집 (최소 필요): 이벤트 (등록, 로그인, 메시지/반응, 보고서), 공개 프로필, 메타 데이터 요청 (필요하지 않은 경우 민감한 컨텐츠를 저장하지 않고).
2. 청소: 중복 제거, 시간/언어 통일, 스팜 필터.
3. 농축: 세션 별 집계, 시간 창 (최소/시간/일), 네트워크 기능 (정도, 클러스터).
4. 벡터화: 텍스트/바이오 임베딩 (허용 가능한 경우), 범주 형 기능.
5. 모델: 가짜 분류기 → 그래프 커뮤니티 검출기 → 이상 검출기.
6. 활성화: 위험 대시 보드, 경고, 케이스 칸반, 반자동 동작 (속도 제한/신념/검토).
3) 모델 스택 (복잡성 증가)
규칙 + 임계 값 (기준): 동작 빈도, 계정 × 강도의 신선도, 비정상적인 시간 창.
분류기 (로그/그라디언트 부스팅): 동작 기능, 내용, 간단한 그래프 기능.
그래프 분석: PageRank/Betweenness, Louvain/Leiden (밀집된 커뮤니티 검색), "교량" 및 계단식 식별.
Anomalies/time series: STL/Prophet, 격리 숲, 활동 별 1 클래스 SVM.
혼합 접근 방식: 확률 보정이있는 앙상블 "분류 자 + 그래프 + 이상".
좋은 관행: 의사 결정을 정당화하고 오류 위험을 줄이기 위해 모델을 해석 가능하게 유지하십시오 (SHP/기능 중요도).
4) 품질 지표 및 오류 제어
Precision @ k/Recall @ k: 상위 위험 임계 값의 정확성과 완전성.
FPR (거짓 양성): 정직하고 실수로 가짜로 표시되는 비율-가능한 한 낮게 유지하십시오 (대상 p95).
AUC-PR: AUC-ROC보다 클래스 불균형이 심합니다.
완화 시간: 트리거에서 소프트 측정까지의 시간 (속도 제한/검토).
이의 제기 CSAT: 항소 만족 (속도, 설명의 질).
5) 사건의 결정: 소프트 측정 → 에스컬레이션
소프트 (기본값)
게시/반응에 대한 속도 제한.
간단한 동작을위한 "도전" (새 동작의 경우 읽기 전용 N 분).
조용한 확인: 이메일/전보 링크 확인, 간단한 캡차.
평균
외부 링크/미디어를 미니 온 보딩으로 제한합니다.
중재 전에 논란의 여지가있는 게시물의 그림자 조
비정형 패턴으로 추가 정보 (민감한 데이터없이) 를 요청하십시오.
어려운 (인간 검증 후)
임시 동결.
프로모션/추첨 참여 취소.
상금 금지 및 철회 (조건이 위반되는 경우).
6) 매일/주간 대시 보드
매일
새로운 "위험 등급" 계정 (낮음/중간/높음).
동일한 소스/타임 슬롯에서 등록 버스트.
고밀도, 반복 가능한 리트 윗/리포스트 네트워크.
링크/도메인 및 "연소" 중재 사례에 의한 변칙적.
주간
FPR/FNR 동향, 호소, 구문 분석 시간.
실제 청중에게 최고의 가짜 클러스터와 "브리지".
보호 조치의 ROMI: 얼마나 많은 스팜/사기가 방지되는지 (추정).
실수로 복고풍: 그것이 잘못 작동하거나 늦게 작동하는 곳, 우리가 규칙에서 바꾸는 것.
7) 90 일 로드맵
1-30 일-재단
개인 정보 보호/AI/항소 정책; 공공 코드 (금지).
기준 규칙 및 최소 캡차/챌린지.
이벤트 수집/청소; 기본 대시 보드 (등록, 주파수, 간단한 이상).
31-60 일-모델 및 열
예제에 따른 가짜 분류기 (해석 된 기능).
그래프 회로: 커뮤니티 감지, "브리지", 리포스트 계단식.
반자동 측정: 속도 제한, 링크 제한, 조용한 검증.
품질 측정 항목 + 이의 제기 프로세스 (SLA λ72h).
61-90 일-견고성 및 오류 감소
앙상블 "분류 자 + 그래프 + 이상", 임계 값 보정.
A/B 소프트 측정 (정직한 사용자를 덜 해치는 측정).
오 탐지의 주간 사후 사후; 기능 업데이트.
분기 별 보고서: FPR/FNR, 시간 완화, 항소 CSAT, 경제 효과.
8) 점검표
가짜 방지 회로 시작
- 공개 된 코드 및 항소 정책.
- 필요한 최소 이벤트를 수집하고 안전하게 보관하십시오.
- 기본 규칙 + captcha/challenge가 활성화되었습니다.
- 등록, 활동 및 이상의 대시 보드.
- 논란의 여지가있는 사건에 대한 Human-in-the-loop 프로세스.
모델 품질
- 검증을 위해 연기 된 선택.
- 분배 전환 모니터링
- 설명 할 수없는 기능의 중요성.
- 주간 복고풍 오 탐지.
- 빠른 조정 및 데이터 명령 링크.
9) 통신 템플릿
소프트 측정 공지 (짧은)
추가 검증 요청
항소에 대한 답변
10) 윤리, 개인 정보 보호, 책임있는 게임
데이터 최소화: 불필요하게 저장하지 마십시오. 가능하면 골재와 익명화를 사용하십시오.
투명성: 분석 할 신호와 이유를 설명하십시오. 이해할 수있는 항소 절차를 제공하십시오.
Human-in-the-loop: 최종 엄격한 조치-중재자/규정 준수에 의해 검증 된 후에 만 가능합니다.
RG- 프레임: 위험을 감수하지 않습니다. 우선 순위-사용자의 안전과 복지.
현지화: 지역 데이터 및 통신법을 고려하십시오.
11) 빈번한 실수와 피하는 방법
하나의 신호에 "하드 금지" 를 넣으십시오. 앙상블과 인간 확인을 사용하십시오.
잘못된 양성을 무시합니다. 측정 FPR, 호소 추적 및 임계 값 개선.
블랙 박스. 의사 결정의 설명은 항소의 신뢰성과 질을 향상시킵니다.
부드러운 측정 부족. 요율 제한/과제로 시작하고 즉시 "처벌" 하지 마십시오.
업데이트 불가능한 규칙. 농장이 적응하고 있습니다. 2-4 주마다 검토 기능.
AI는 "매직으로 봇을 잡지" 않습니다. 행동, 콘텐츠 및 네트워크 신호에서 모자이쿠를 추가하여 제 시간에 부드럽고 정직하게 반응합니다. 투명한 정책, 호소, Human-in-the-loop 및 정기적 인 모델 개정을 통해 소음을 줄이고 프로모션을 보호하며 라이브 사용자의 신뢰와 커뮤니티의 건강을 유지합니다.