レポート品質を最大化するためのファイルアップロードのコツと推奨設定をご紹介します。
ファイル形式によって、AIがドキュメントの構造(表・見出し・リスト)をどれだけ正確に理解できるかが変わります。
| 形式 | 構造保持 | 推奨度 | 備考 |
|---|---|---|---|
| Markdown (.md) | ◎ 完全 | ⭐⭐⭐ | 最も推奨。構造が明確 |
| Word (.docx) | ◎ 完全 | ⭐⭐⭐ | 表・見出しを正確に認識 |
| HTML (.html) | ○ 良好 | ⭐⭐ | Webページからの変換に |
| テキスト (.txt) | △ 部分的 | ⭐ | タブ区切り表は認識可能 |
| CSV / Excel | ◎ 完全 | ⭐⭐⭐ | 表データに最適 |
| PDF (.pdf) | × 失われる | 非推奨 | 変換を推奨 |
💡 ヒント
同じ内容であれば、PDFではなくDOCXやMarkdownをアップロードすると、表や見出しが正確に認識され、より高品質なレポートが生成されます。
⚠️ なぜPDFの変換が必要なのか?
PDF形式は構造情報(表・見出し・リスト)が失われやすく、AIがドキュメントを正確に理解できない場合があります。DOCXやMarkdown形式に変換することで、レポートの精度が大幅に向上します。
PDFの元となったWord文書(.docx)やMarkdownファイル(.md)がある場合は、PDFではなくそちらをアップロードしてください。元のファイルには完全な構造情報が保持されています。
GSN(Goal Structuring Notation)ファイルは、安全性論証の構造を表す重要なドキュメントです。適切に設定することで、レポートの品質が向上します。
📌 GSNファイルの推奨設定
• 「GSN」チェックボックスをONにする → レポート構成にGSN分析セクションが追加されます
• 「全文使用」をONにする → GSNは構造が重要なため、全文をAIに渡すことを推奨します
以下のフォーマットで記述します:
要素タイプ:
G: Goal(ゴール)S: Strategy(戦略)C: Context(コンテキスト)Sn: Solution(ソリューション/エビデンス)→: 接続(親から子への関係)「全文使用」オプションは、ファイルの全内容をそのままAIに渡す機能です。通常はRAG(関連部分の抽出)を使用しますが、以下のケースでは全文使用が効果的です。
⚠️ 制限事項
• 1ファイルあたり最大 50,000文字(超過分は切り詰め)
• 大きいファイル(5万文字以上)の全文使用は 最大2個まで
本ツールでは、ドキュメントを効率的に処理するために高度なチャンキング(分割)戦略を採用しています。
ドキュメントの構造(見出し、セクション)を認識し、意味的なまとまりを保ったまま分割します。
| パラメータ | 値 | 説明 |
|---|---|---|
| MIN_SECTION_SIZE | 300文字 | これ以下のセクションは次と結合 |
| MAX_SECTION_SIZE | 1,200文字 | これを超えたらMax-Minで分割 |
| ... | ... | 形式💡 品質向上のポイント
構造が明確なファイル形式(DOCX, Markdown)を使用すると、チャンキングの精度が向上し、検索時に適切なコンテキストが取得されやすくなります。
Tips and recommended settings for file uploads to maximize report quality.
The file format affects how accurately AI can understand document structure (tables, headings, lists).
| Format | Structure | Rating | Notes |
|---|---|---|---|
| Markdown (.md) | ◎ Complete | ⭐⭐⭐ | Highly recommended. Clear structure |
| Word (.docx) | ◎ Complete | ⭐⭐⭐ | Tables & headings accurately recognized |
| HTML (.html) | ○ Good | ⭐⭐ | Good for web page conversions |
| Text (.txt) | △ Partial | ⭐ | Tab-separated tables are recognized |
| CSV / Excel | ◎ Complete | ⭐⭐⭐ | Best for tabular data |
| PDF (.pdf) | × Lost | Not Recommended | Conversion recommended |
💡 Tip
For the same content, uploading DOCX or Markdown instead of PDF will result in more accurate recognition of tables and headings, producing higher quality reports.
⚠️ Why is PDF conversion necessary?
PDF format tends to lose structural information (tables, headings, lists), making it difficult for AI to accurately understand documents. Converting to DOCX or Markdown format significantly improves report accuracy.
If you have the original Word document (.docx) or Markdown file (.md) that was used to create the PDF, upload that instead of the PDF. The original file retains complete structural information.
GSN (Goal Structuring Notation) files are important documents representing safety argument structures. Proper settings improve report quality.
📌 Recommended GSN Settings
• Enable "GSN" checkbox → Adds GSN analysis section to report structure
• Enable "Full Text" → Recommended because GSN structure is important
Element Types:
G: GoalS: StrategyC: ContextSn: Solution (Evidence)→: Connection (parent to child relationship)The "Full Text" option passes the entire file content to AI. Normally RAG (extracting relevant parts) is used, but full text is effective in these cases:
⚠️ Limitations
• Maximum 50,000 characters per file (excess is truncated)
• Full text for large files (50,000+ chars) limited to 2 files max
This tool uses advanced chunking (splitting) strategies for efficient document processing.
Recognizes document structure (headings, sections) and splits while maintaining semantic coherence.
| Parameter | Value | Description |
|---|---|---|
| MIN_SECTION_SIZE | 300 chars | Sections smaller than this are merged |
| MAX_SECTION_SIZE | 1,200 chars | Sections larger than this are split |
| ... | ... | format💡 Quality Improvement Tip
Using file formats with clear structure (DOCX, Markdown) improves chunking accuracy and retrieves more appropriate context during search.