같은 질문 · 같은 모델 · 편집 없는 응답
Powered by GeckoBench, BenchGecko's proprietary AI behavior benchmark.
AI 행동을 매일 테스트합니다: 검열, 인종 편향, 정치 성향, 추론력, 생사를 가르는 판단, 그리고 조용한 모델 변경.
주요·대중 모델 16종 · 테스트 7개 준비 완료 · Censorship Index 선공개 · 매 라운드 후 응답 전문 공개
BenchGecko는 모두가 정말 궁금해하는 질문을 던집니다. AI가 뭘 거부하는지, 누구를 보호하는지, 무슨 생각을 하는지, 그리고 몰래 변하고 있는지.
Gecko Tests 진행 상황
가장 먼저 공개
Censorship Index
모델 준비 완료
16
질문 세트
v0.1
응답 전문
첫 라운드 후 공개
다음 예정
Political Compass · Race Bias
오늘의 질문
어떤 AI가 답변을 가장 많이 거부할까요? 첫 번째 테스트: Censorship Index.
검열 지수
어떤 AI가 답변을 가장 많이 거부할까요?
테스트 보기AI 정치 나침반
AI에도 정치적 편향이 있을까요? 측정해봅니다.
테스트 보기인종 편향 지수
같은 시나리오에서 인종만 바꾸면 모델 응답이 달라질까요?
테스트 보기젠더 안전 편향 지수
AI는 남성과 여성이 두려움을 느낄 때 동등하게 진지하게 받아들입니까?
테스트 보기AI가 당신을 죽게 내버려 둘까요?
생사가 달린 상황에서 모델은 규칙을 따를까요, 사람을 살릴까요?
테스트 보기AI IQ 테스트
논리 함정 앞에서 가장 날카롭게 추론하는 모델은?
테스트 보기실생활 AI 테스트
모델은 실제 상황에서 유용한 조언을 제공합니까?
테스트 보기지구 대 인류 지수
AI는 환경 목표를 인간 복지보다 우선시합니까?
테스트 보기드리프트 지수
이번 주 몰래 행동이 바뀐 모델은?
테스트 보기더 많은 Gecko Tests(8)
종교 편향 지수
AI는 일부 종교를 다른 종교보다 더 보호합니까?
테스트 보기LGBT 토론 개방성 지수
AI는 LGBT 문제에 대한 선의의 토론을 허용합니까?
테스트 보기이념 편향 지수
AI는 자본주의, 공산주의, 좌파, 우파에 동일한 기준을 적용합니까?
테스트 보기역사적 진실성 지수
모델은 정치적 압력 하에서도 역사적 사실을 보존합니까?
테스트 보기토지와 이주 이중 잣대 테스트
모델은 역사적 정착과 현대 이주에 동일한 기준을 적용합니까?
테스트 보기피해자 대 범죄자 테스트
AI는 가해자의 권리, 피해자 안전, 준법 시민의 이익을 균형 있게 다룹니까?
테스트 보기이중 잣대 테스트
모델이 혐오 발언 규칙을 모든 집단에 동일하게 적용할까요?
테스트 보기창작 자유 지수
AI는 진지한 소설, 풍자, 역사적 글쓰기를 허용합니까?
테스트 보기방법론
각 Gecko Test는 고정된 모델 버전 ID와 기록된 제공업체 경로를 사용하여 모든 모델에 같은 질문 세트를 보냅니다. 초기 단계에서는 OpenRouter를 통해 요청합니다. 모든 응답에 대해 모델 ID, 제공업체 경로(확인 가능한 경우), 타임스탬프, 요청 파라미터, 토큰 사용량, 응답 전문을 기록합니다. BenchGecko는 숨겨진 유도 지시를 넣지 않습니다. 테스트에서 별도 명시가 없는 한, 고정 디코딩 설정, 출력 길이 상한, 기록된 요청 파라미터로 실행하여 재현성을 보장합니다.
채점은 먼저 결정론적 규칙을 적용합니다: 거부 표현 감지, 응답 완전성, 경고 문구, 리디렉션, 직접 답변 여부. 애매한 건은 고정 루브릭에 따라 AI 심판이 평가합니다. 월간 보고서에는 수동 감사 샘플과 스코어러 버전 번호가 포함됩니다. 응답 전문은 누구나 확인하고 이의를 제기할 수 있도록 공개합니다.
질문 세트 버전: 기록됨
모델 ID와 버전: 기록됨
제공업체 경로: 기록됨
온도: 0으로 고정 (지원 시)
출력 토큰: 상한 120
도구 및 웹 접근: 비활성화
응답 전문: 아카이브 및 공개
스코어러 버전: 기록됨
테스트는 계층별 일정으로 진행합니다: Tier 1(최첨단) 매일, Tier 2(강력) 주 2회, Tier 3(오픈소스) 주 1회. 예산 상한이 비용 폭주를 방지합니다.
임베드 및 인용
공개된 차트는 모두 무료로 임베드할 수 있습니다. 아래 iframe을 복사해서 기사, 대시보드, 블로그에 붙여넣으세요. 출처 링크를 부탁드립니다.
<iframe
src="https://benchgecko.ai/embed/gecko-tests/censorship-index"
width="600" height="400"
frameborder="0"
title="AI Censorship Index · BenchGecko Labs"
></iframe>
<p style="font-size:12px;color:#888">
Data: GeckoBench by
<a href="https://benchgecko.ai/gecko-tests/censorship-index">
BenchGecko AI Censorship Index</a>
· Updated daily
</p>