stream 옵션을 true로 설정하면 응답을 청크 스트림으로 받을 수 있으므로,
전체 응답이 생성될 때까지 기다리지 않고 결과를 점진적으로 표시할 수 있습니다.
스트리밍 출력은 모든 호스팅된 모델에서 지원됩니다. 특히 추론 모델과 함께
사용하는 것을 권장합니다. 스트리밍하지 않는 요청은 출력이 시작되기 전에 모델이
너무 오래 생각하면 시간 초과될 수 있기 때문입니다.
- Python
- Bash
W&B Inference에서 스트리밍 출력을 활성화해 생성되는 모델 응답을 점진적으로 받을 수 있습니다.
stream 옵션을 true로 설정하면 응답을 청크 스트림으로 받을 수 있으므로,
전체 응답이 생성될 때까지 기다리지 않고 결과를 점진적으로 표시할 수 있습니다.
스트리밍 출력은 모든 호스팅된 모델에서 지원됩니다. 특히 추론 모델과 함께
사용하는 것을 권장합니다. 스트리밍하지 않는 요청은 출력이 시작되기 전에 모델이
너무 오래 생각하면 시간 초과될 수 있기 때문입니다.