AI EngineeringSeptember 10, 202513 min read
    SC
    Sarah Chen

    AI 생성 텍스트의 문제점은? 신경망 쓰기의 일반적인 결함

    AI 생성 텍스트의 문제점은? 신경망 쓰기의 일반적인 결함

    AI 생성 텍스트의 문제점은 무엇인가? 신경망 쓰기의 일반적인 결함

    신뢰할 수 있는 출처와 비교하여 AI 생성 텍스트를 검증하고, 출판 전에 인간 편집자로부터 독립적인 확인을 받으십시오. 이 단계는 환각을 줄이고 독자들을 잘못된 정보로부터 보호합니다. 확인 후, 독자들이 사실을 추적할 수 있도록 출처에서 온 사실과 모델이 생성한 사실을 문서화하십시오. 모델이 출처를 인용하고 증거 없이 주장하는 것을 제한하도록 지시하는 간결한 프롬프트를 만드십시오. 또한 명확성을 위해 어떤 단어가 출처에서 왔고 어떤 것이 모델에 의해 생성되었는지 기록하십시오.

    작가들은 진실이 아닌 다음 단어를 최적화하므로, 문장이 잘 읽히는 확률이 올바른 확률을 앞지를 수 있습니다. 일부 단락은 일반적인 구문을 반복하고 참조를 생략하여 신뢰성을 약화시킵니다. 누락된 출처, 회피 언어, 섹션 간 일관되지 않은 데이터와 같은 신호를 찾아보십시오. 위험을 줄이기 위해 주장 옆에 출처 태그를 요구하고, 검증 불가능한 진술을 표시하는 사실 확인 워크플로를 구현하십시오. 또한 드리프트를 줄이고 프롬프트와의 일치성을 보장하기 위해 생성된 구절의 길이를 제한하십시오.

    환각–신뢰할 수 있지만 증거가 부족한 주장. 일부 주제는 훈련 데이터에서 과소 대표되어 해석 오류나 편향을 초래합니다. 일부 전문가들의 의견에 따르면, 모델은 현실에서 발생하지 않은 그럴듯한 세부 사항으로 공백을 채웁니다. 환각을 탐지하기 위해 텍스트를 기본 출처와 비교하고 인용, 숫자, 날짜를 독립 데이터베이스나 공식 기록으로 검증하십시오. 출력을 실제 문서에 고정하기 위해 검색 강화 생성을 구현하십시오.

    실용적인 단계에는 검색 증강 워크플로가 포함되며, 시스템이 먼저 신뢰할 수 있는 출처를 가져온 후 이를 인용하는 텍스트를 생성합니다. 사실 주장마다 명시적인 출처를 요구하도록 프롬프트를 설계하고 모델에게 출처의 제목과 저자를 인용하도록 지시하십시오. 체크리스트를 만드십시오: 사실 검증, 출처 인용, 날짜 정확, 출처 정의와 일치하는 수치. 인간-인-더-루프 검토를 실행하고 책임을 위해 변경 사항의 버전 기록을 유지하십시오. 인용률과 검증 불가능한 진술률과 같은 지표를 추적하여 지속적인 개선을 안내하십시오.

    AI 생성 텍스트의 문제점은 무엇인가? 실용적인 프롬프트와 품질 확인

    AI 생성 텍스트의 문제점은 무엇인가? 실용적인 프롬프트와 품질 확인

    구체적인 목표로 시작하십시오: 작업, 요구 형식, 품질을 판단할 지표를 정의하십시오. 이 방법은 모호함을 줄이고 openai를 통해 gpt-3에서 더 신뢰할 수 있는 정보를 얻는 데 도움이 됩니다. 작업을 시작할 때, 간결한 요약, 단계별 가이드, 또는 코드 스니펫이 필요한지 지정하고, 제약 조건과 하나의 작업에 필요한 정보를 나열하십시오. 프로세스는 작업의 구성 요소를 안내하는 명시적인 프롬프트에 의존합니다; 우리의 접근 방식은 프롬프트에 대한 주의와 작업 이행을 강조합니다. 모델은 광범위한 정보 기반으로 훈련되었으며, 일반적인 패턴을 반복할 수 있어 글자와 구문을 형성합니다. 따라서 출처의 기록을 강제하고 모호한 결론을 피하기 위해 검증 가능한 정보를 요구하십시오. 이 프레임워크는 원치 않는 생성물을 제한하고 출력에 스며드는 무미건조한 클리셰와 템플릿을 줄입니다. 또한 작업을 명확하게 하고 독자들이 확인할 수 있는 루브릭을 사용합니다.

    적용할 수 있는 품질 확인

    적용할 수 있는 품질 확인은 간단합니다: 따를 단계가 있습니다. 단계 1: 신뢰할 수 있는 출처와 사실 정확성을 검증하십시오; 단계 2: 반복이나 일반적인 구문을 확인하십시오; 단계 3: 가독성을 위해 철자와 글자를 검사하십시오; 단계 4: 정보가 작업과 일치하고 벗어나지 않도록 보장하십시오; 단계 5: 주장을 뒷받침하는 출처의 기록을 검증하십시오. 각 확인은 텍스트를 이끈 프롬프트와 프롬프트에 대한 주의를 요구합니다. 시작할 때, 안정성을 얻기 위해 확장 전에 작은 샘플에 빠른 테스트를 실행하십시오. 이 접근 방식은 gpt-3와 openai를 사용할 때 작동하며, 출력이 진정한 정보와 일치하도록 평가하는 명확한 기반을 제공합니다.

    신뢰할 수 있는 출력을 유도하는 프롬프트

    신뢰할 수 있는 출력을 유도하기 위해, 맥락을 설정하고 시작 시점을 지정하며 엄격한 구조를 요구하는 프롬프트를 작성하십시오. 프롬프트는 출력당 하나의 작업, 원하는 형식(글머리 기호, 제목, 길이), 증거의 기록이나 기록을 요구해야 합니다. 정보를 검색할 때, 단일 줄보다 더 많은 정보를 요청하고 가능하다면 인용을 요구하십시오. 실용적인 예: "당신은 X에 대한 문서를 요약하는 어시스턴트입니다. 주요 포인트의 한 단락 요약을 제공한 후, 출처에 대한 기록이 있는 사실의 글머리 기호 목록을 따르십시오. 정보를 가져오기 위해 gpt-3와 openai를 사용하지만 환각을 제한하십시오." 이 종류의 지침은 프로세스가 작업에 집중되도록 돕고, 특히 우리 팀이 많은 출처와 작업할 때 드리프트를 줄입니다.

    AI 텍스트에서 환각, 물렁함, 중복 구문 탐지

    권장 사항: 모든 사실 주장을 신뢰할 수 있는 자료와 검증하십시오; 확인할 수 없으면 의심스럽다고 표시하고 출처를 요청하십시오. 인용을 요구하는 프롬프트를 사용하십시오; 일반적으로 사용되는 프롬프트 변형은 모델에게 출처를 인용하고 확인을 제공하도록 지시합니다. 긴, 물렁한 구절을 방지하기 위해 토큰에 제한을 두십시오. 클리셰나 관련 없는 단어와 같은 방황하는 용어를 발견하면 출력에서 제거하십시오. 간결하고 직접적인 언어만 사용하십시오; 가치가 추가되지 않는 불필요한 삽입을 피하고 신뢰할 수 있는 출처에서 정보를 추출하십시오.

    일반적인 특징과 빠른 확인

    환각은 자료로 추적할 수 없는 발명된 날짜, 이름, 또는 숫자로 나타납니다; 물렁함은 패딩 단어가 있는 긴 회피 문장으로 나타납니다; 중복 구문은 약간 다른 형태로 같은 아이디어를 반복합니다. 각 의심스러운 주장에 대해 최소 두 개의 독립 출처와 빠른 확인을 실행하고, 해당 출처로부터 명확한 확인을 찾아보십시오. 불일치가 있으면 표시하고 사용한 출처를 첨부하십시오. 출력이 정확한 글자를 사용하고 프롬프트의 공백이나 텍스트 오류를 나타낼 수 있는 왜곡된 텍스트를 피하도록 보장하십시오. 특히 처리 능력이 제한된 장치(기기)에서.

    지금 적용할 수 있는 실용적인 단계

    이 단계를 순서대로 적용하십시오: 먼저, 단락당 하나의 주요 아이디어로 문장 길이를 줄여 물렁한 스타일을 비활성화하십시오; 둘째, 프롬프트에 직접 인용이나 정확한 숫자와 인용을 요구하는 두 출처 규칙을 강제하십시오; 셋째, 모델이 필러로 드리프트하지 못하도록 엄격한 토큰 제한을 설정하십시오. 주장을 확인할 수 없을 때, 주의 사항으로 응답하고 확인을 위한 자료를 제안하십시오. 일반적으로 사용되는 우리 프롬프트 변형을 사용하십시오: "출처를 인용하고, 확인을 제공하며, 진술을 단단히 기반으로 유지하십시오." 주장이 뉘앙스에 의존할 때, 짧은 맥락을 제시하되 텍스트를 과부하시키지 마십시오. 품질 관리를 위해 후처리 확인을 실행하십시오: 반복, 불필요한 형용사, 핵심 논증에 새로운 것을 추가하지 않는 구문을 찾아보십시오. 문장이 모호한 일반화에 의존할 때, 구체적인 예시나 숫자를 포함하도록 다시 작성하십시오. 언어를 선명하게 유지하고, 확신이 없을 때는 오류를 퍼뜨리는 위험을 피하기 위해 재구성하는 것이 낫습니다.

    생각의 나무 (ToT): 더 나은 추론을 위한 단계별 프롬프팅 루틴

    최종 답변을 확정하기 전에 각 단계에서 명시적인 확인을 포함하는 체인-오브-솟 프롬프트 요청을 단계별로 시작하십시오. 이는 추론의 구성 과정을 투명하게 유지하고 최종 판단을 감사하기 쉽게 만듭니다.

    우리 기사와 자료에서 이러한 프롬프팅은 실용적인 루틴으로 설명됩니다: 단계의 계획과 기록, 각 체크포인트에서 확인과 함께 추론, 최종 합성. 이러한 접근 방식은 주요 이정표가 다루어지도록 돕고, 관련된 작업과 결론의 확률을 판단하는 방법을 보장합니다. 프로세스는 다음 이동을 안내하는 프롬프트에 의존하며, 감사와 필요 시 결과를 보내기 위해 각 단계의 기록을 유지합니다.

    1. 작업 프레임과 기준 – 문제를 명확히 진술하고, 예상 주요 결과와 정확성을 확인하는 방법을 포함하십시오. 성공을 정의하는 지표를 포함하고, 추론의 기반이 되는 가정을 기록하십시오. 맥락이 누락된 경우, 주장을 뒷받침하는 출처의 주소에 대한 간단한 지침을 포함하십시오. 이 단계는 정확한 생성을 위한 무대를 설정하고 드리프트를 방지합니다; 그렇지 않으면 결론이 원래 목표에서 벗어날 수 있습니다.

    2. 하위 작업으로 분해 – 목표를 데이터 수집, 가설 생성, 증거 평가와 같은 하위 작업으로 분해하십시오. 각 하위 작업에 도달하기 위해 필요한 단계를 지정하고, 다른 요인이 결과에 영향을 미칠 수 있는 방식을 지시하십시오. 이는 독자들이 답변의 구성 과정을 보고 어떤 가정이 테스트되고 있는지 보는 데 도움이 됩니다.

    3. 계획과 기록 – 이정표와 결정의 로깅 기록으로 구성된 컴팩트한 계획을 구축하십시오. 주요 출처의 주소와 각 주장을 뒷받침하는 데 사용될 데이터를 기록하십시오. 이 단계에서 시작함으로써, 미래 프롬프트와 협업을 위한 재사용 가능한 스캐폴드를 만듭니다.

    4. 단계별 추론 – 명확히 라벨링된 단계로 추론을 생성하고, 다음 행동에 대한 간결한 프롬프트를 포함하십시오. 토큰 사용을 확인하기 위해 각 단계를 소수의 문장으로 제한하고, 순서를 쉽게 검토할 수 있게 하십시오. 이 단계는 나중에 확인할 수 있는 가설을 모델이 형성하는 곳입니다.

    5. 검증과 체크포인트 – 각 주장에 대해 이용 가능한 증거로부터 확인을 제공하거나 잠정적이라고 명확히 기록하십시오. 논리가 공백을 보이면 불확실성을 진술하고 대안 가설(다른)로 전환하십시오. 체인이 초기 작업과 기준에 논리적으로 연결되어 있는지 항상 확인하십시오.

    6. 반복과 튜닝 – 확인이 실패하면 계획을 수정하거나 가정을 조정하거나 하위 작업을 재구성하십시오. 올바른 결론의 확률이 높아지고 전체 구성이 일관되도록 반복하십시오. 이 단계는 초기 실수를 견디는 프로세스를 유지합니다.

    7. 최종화와 문서화 – 간결한 정당화 추적으로 최종 답변을 컴파일하십시오. 단계의 기록 로그, 사용된 토큰, 주요 출처의 주소를 포함하십시오. 결과를 공유해야 할 경우, 사용자에게 간결한 요약을 보내고 우리 기사 자료와 관련 주요 기사에서 더 깊은 분석을 찾을 수 있는 포인터를 제공하십시오.

    기반과 검증: 인용과 출처 확인으로 환각 줄이기

    모든 답변을 검증 가능한 출처에 사실을 연결하여 기반하고, 제시하기 전에 원본 문서와 인용을 검증하십시오. 사실 주장당 하나의 신뢰할 수 있는 출처를 사용하고, 출처 유형(기본 기사, 데이터셋, 표준 문서, 또는 기관 보고서)에 대한 간단한 메모를 첨부하십시오.

    주장, 자료, 출처를 명확히 분리하는 프롬프팅 템플릿을 설계하십시오. 증거를 가져올 위치를 지정하는 프롬프트 블록을 포함하고, 프롬프트에 출처 목록을 추가하십시오. 언어 모델을 확인 가능한 단계로 안내하기 위해 이러한 형식을 사용하고, gpt-3와 최신 반복에 대해 워크플로를 타이트하게 유지하십시오.

    모든 비자명 진술에 명시적인 인용을 요구하고 기본 출처를 선호하십시오. 접근 날짜와 출판사와 함께 URL을 나열하고, 존재할 경우 DOI를 포함하십시오. gpt-3 기반 프롬프트의 경우, 모델이 전용 출처 섹션에 출처 목록을 반환하도록 강제하고 식별자를 조작하지 않도록 하십시오. 출처가 누락된 경우 명확히 표시하고 대안을 제안(다른 출처 사용)하여 사용자가 자료와 확인할 수 있게 하십시오.

    생성을 검증과 분리하는 검증 워크플로를 채택하십시오. 응답을 생성한 후, 나열된 출처에 대한 별도의 조회를 수행하고 주장을 출처 텍스트와 비교하며 불일치를 표시하십시오. 모델이 출처를 자신의 말로 요약하도록 요청한 후 가능하다면 직접 인용하거나 인용 일치를 하는 프로빙 프롬프트(샷)를 사용하십시오. 다양한 출처 간 모순 확인을 포함하고 불확실한 증거에 의존하는 주장을 강조하십시오. 공백이 있으면 다른 자료 세트로 재시도하고 주요 질문과 구체적인 작업에 초점을 맞춰 작업을 세밀하게 조정하십시오.

    환각을 방지하기 위해 프롬프팅 장치(기기)에 구성 요소 기반 접근 방식을 구현하십시오. 검색 모듈, 인용 생성기, 검증기를 별도의 블록으로 구축하고 각 블록을 감사 가능하게 유지하십시오. 메모리에서 추출된 콘텐츠 양에 제한을 설정하고 체크리스트 같은 프롬프트가 매 단계에서 확인을 트리거하도록 요구하십시오. 다른 복잡성의 모델(모델)을 사용할 때, 작은 모델에 대한 간결한 출처 추출과 큰 모델에 대한 더 풍부한 교차 출처 분석으로 프롬프트를 맞춤화하십시오. 이러한 구성을 사용하여 출력을 실제 출처와 일치시키고 메모리 과도 의존을 피하십시오. 특히 gpt-3에서 프롬프트가 출처 제약을 생략하면 환각이 더 발생할 가능성이 큽니다. 기본 자료와 동료 검토 리뷰의 혼합을 시도하여 폭과 깊이를 균형 맞추십시오.

    단계작업출력 예시
    1프롬프트 프레임주장: "X가 발생합니다." 출처: [URL 또는 DOI]. 검증: "출처가 확인합니다."
    2출처 선택주장당 하나의 출처만; 검증에 사용된 자료(자료)를 나열하십시오.
    3인용 세부 사항저자, 연도, 제목, 장소, URL, 접근 날짜; 이용 가능한 경우 DOI.
    4검증 샷출처가 주장을 어떻게 뒷받침하는지 요약하는 짧은 단락 (샷).
    5교차 확인대안 출처(다양한)와 비교; 충돌(환각)을 기록하십시오.
    6공개어떤 부분이 검증되지 않았는지 표시하고 다음에 확인할 것을 (확인) 제안하십시오.

    편집 위생: 철자, 구두점, 템플릿 구문과 반복 피하기

    두 단계 확인으로 시작하십시오: 빠른 철자와 구두점 통과, 그 다음 기본 정보와 인간 사실 확인. 텍스트가 모델, 특히 openai에 의해 생성된 경우, 이 두 번째 검토는 환각을 포착하고 출력을 우리 프로세스와 사실과 일치시킵니다. 텍스트는 출판 준비가 되고 독자들을 위해 준비됩니다.

    주요 본문에서 템플릿을 유지하십시오; 일부 템플릿이 초안에 스며들고 반복이 증가합니다. 살아 있는 용어집과 재작성 루틴을 유지하여 보일러플레이트를 신선한 표현으로 교체하십시오. 목소리가 모드와 복잡한 주제 전반에 일관되도록 철자, 구두점, 단어 선택에 대한 스타일 가이드를 적용하십시오. 항상 신뢰할 수 있는 정보 출처로 사실을 검증하고 구문을 문자 그대로 번역하지 마십시오; 대신 오해를 피하기 위해 우리 자신의 말로 요약하십시오. 신뢰할 수 있는 출처의 정보를 사용하고 각 주장이 어떻게 정당화되는지(설명) 설명하여 투명성을 유지하십시오.

    두 가지 실용적인 단계

    단계 1: 템플릿 드리프트 중지 보일러플레이트를 저장소에 중앙화하고 각 조각에 대해 의역하십시오. 하나의 모델이 사용될 때, 원본 출처와 구절을 비교하여 구문을 재활용하지 않도록 보장하십시오. openai 출력의 경우, 사실을 검증하고 구문을 문자 그대로 번역하지 마십시오; 우리 스타일에 맞는 신선한 표현으로 다시 작성하십시오. 반복에 제한을 두십시오: 600단어 텍스트에서 동일한 구문을 공유하는 문장의 2% 미만을 목표로 하십시오.

    단계 2: 편집 워크플로 강화 두 통과 워크플로를 강제하십시오: 기계적 확인(철자, 구두점)과 콘텐츠 확인(사실, 명확성). 번역이나 적응 후, 리듬을 테스트하고 정보가 정확하게 유지되는지 소리 내어 읽으십시오. 이메일이나 openai 로그에 주석을 사용하여 제안을 포착하고 기여자에게 변경을 설명(조언)하십시오; 이는 신뢰를 구축하고 미래 편집을 돕습니다.

    편집 위생 측정

    지표가 프로세스를 고정합니다: 1000단어당 오철자율 0.5% 미만, 구두점 정확도 95% 이상, 문장 반복률 2% 미만. 이메일, 티케팅, 편집자 노트를 통해 피드백을 수집하십시오; 출판 후, 변경된 사실(사실)과 이유를 기록하십시오. 복잡한 주제를 다룰 때, 짧은 용어집을 첨부하십시오; 텍스트가 환각에 의해 왜곡되지 않고 실제적이고 유용하게 유지되도록 보장하십시오. 모델을 사용하는 시스템은 실수로부터 배우고 프로세스를 개선하기 위해 정기적으로 감사받아야 합니다.

    체크리스트: 이메일, 더, 새로운, 일부, 모드, 복잡한, 언제, 후, 그런, 시스템, 어느, 환각, 사용, 모델, 하나의, 정보, 제한, 텍스트, 준비된, 모델, 실제, 어느, 우리, 프로세스, 사실, 번역, openai, 조언, 단어, 설명.

    ChatGPT 시작하기: 등록과 첫 콘텐츠 생성

    실제 이메일로 등록하고 계정을 검증하며 접근을 보호하기 위해 2단계 인증을 활성화하십시오. 온보딩 흐름은 계획 선택과 언어 선호도를 설정하도록 안내하며, 이는 출력이 당신의 텍스트와 다른 콘텐츠와 일치하도록 돕습니다. 이 설정은 주제와 자료 전반에 신경망 작업을 일관되게 유지합니다.

    등록 기본

    신뢰할 수 있는 장치를 사용하고 이메일을 확인하며 개인정보 보호 제어를 검토하십시오. 프롬프트당 사용된 토큰을 추적하여 시간과 비용을 추정할 수 있습니다. 미래 세션에서 선택에 영향을 미치는 의견의 기록을 유지하십시오.

    다시 로그인할 때, 선호 언어, 톤, 형식 옵션을 저장하십시오. 팀과 작업할 경우, 콘텐츠를 관리하기 위해 역할 기반 접근으로 협력자를 초대하십시오.

    첫 콘텐츠 생성 팁

    첫 작업에 대한 명확한 브리프를 정의하십시오: 단일 초점 메시지가 있는 5문장 구문. 주제 문장으로 시작하고 두 지원으로 이어지며 결론으로 끝나는 구성을 개요하십시오. 생성하려는 콘텐츠의 변형을 선택하고 대상 청중과 시간 프레임을 지정하십시오.

    초안을 생성한 후, 명확성을 검토하고 생각을 조정하며 불필요한 아이디어를 제거하십시오. 출력이 읽기 쉬운 글자를 사용하고 의도된 콘텐츠에 맞는지 검증하십시오. 여러 변형을 비교하고 전달하려는 의견을 가장 잘 반영하는 것을 선택하십시오.

    관련 기사

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation