핵심 개념
LLM이 명령 중심 응답을 생성할 때 발생하는 윤리적 문제와 안전 문제에 대해 조사한 연구
통계
LLM이 명령 중심 응답을 생성할 때 윤리적 문제를 증가시키는 경향이 있음
ROME 기술을 사용하여 편집된 LLM이 더 많은 유해한 콘텐츠 생성에 영향을 미침
인용구
"Despite the integration of advanced safety measures and the employment of human oversight, vulnerabilities remain, notably through sophisticated ‘jailbreaking’ techniques that exploit inherent system weaknesses."
"Our dataset TECHHAZARDQA provides a novel means for auditing the risks associated with pseudocode responses which have become commonplace these days."