📚 アップロードガイド

レポート品質を最大化するためのファイルアップロードのコツと推奨設定をご紹介します。

1. 推奨ファイル形式

ファイル形式によって、AIがドキュメントの構造(表・見出し・リスト)をどれだけ正確に理解できるかが変わります。

形式 構造保持 推奨度 備考
Markdown (.md) ◎ 完全 ⭐⭐⭐ 最も推奨。構造が明確
Word (.docx) ◎ 完全 ⭐⭐⭐ 表・見出しを正確に認識
HTML (.html) ○ 良好 ⭐⭐ Webページからの変換に
テキスト (.txt) △ 部分的 タブ区切り表は認識可能
CSV / Excel ◎ 完全 ⭐⭐⭐ 表データに最適
PDF (.pdf) × 失われる 非推奨 変換を推奨

💡 ヒント

同じ内容であれば、PDFではなくDOCXやMarkdownをアップロードすると、表や見出しが正確に認識され、より高品質なレポートが生成されます。

2. PDF変換ガイド

⚠️ なぜPDFの変換が必要なのか?

PDF形式は構造情報(表・見出し・リスト)が失われやすく、AIがドキュメントを正確に理解できない場合があります。DOCXやMarkdown形式に変換することで、レポートの精度が大幅に向上します。

📝 方法1: Google Docs経由 推奨 無料

  1. Google Drivedrive.google.com)にアクセス
  2. PDFファイルをアップロード
  3. PDFを右クリック → 「アプリで開く」「Googleドキュメント」
  4. ドキュメントが開いたら、「ファイル」「ダウンロード」
  5. 「Markdown (.md)」 または 「Microsoft Word (.docx)」 を選択
  6. ダウンロードしたファイルをアップロード

📘 方法2: Microsoft Word

  1. Microsoft Wordを開く
  2. 「ファイル」「開く」 → PDFファイルを選択
  3. 「PDFから編集可能なWord文書に変換します」というメッセージが表示されたら 「OK」
  4. 「ファイル」「名前を付けて保存」
  5. 形式を 「Word文書 (.docx)」 に設定して保存
  6. 保存した.docxファイルをアップロード

📁 方法3: 元のDOCXを使用

PDFの元となったWord文書(.docx)やMarkdownファイル(.md)がある場合は、PDFではなくそちらをアップロードしてください。元のファイルには完全な構造情報が保持されています。

3. GSNファイルの推奨設定

GSN(Goal Structuring Notation)ファイルは、安全性論証の構造を表す重要なドキュメントです。適切に設定することで、レポートの品質が向上します。

📌 GSNファイルの推奨設定

「GSN」チェックボックスをONにする → レポート構成にGSN分析セクションが追加されます

「全文使用」をONにする → GSNは構造が重要なため、全文をAIに渡すことを推奨します

GSNファイルの作成方法

🛠️ D-Case Communicatorを使用 推奨

  1. D-Case CommunicatorでGSNを作成
  2. 「Export LLM Input Text」機能でテキストファイルを出力
  3. 出力されたテキストファイルをアップロード

手動でGSNテキストを作成する場合

以下のフォーマットで記述します:

G1: システムは安全に運用できる → S1 S1: システム安全と運用リスク制御に分けた議論 → G2, G3 G2: システムは設計上安全である → Sn1 Sn1: 設計レビュー完了報告書

要素タイプ:

4. 全文使用の使いどころ

「全文使用」オプションは、ファイルの全内容をそのままAIに渡す機能です。通常はRAG(関連部分の抽出)を使用しますが、以下のケースでは全文使用が効果的です。

✅ 全文使用が効果的なケース

❌ 全文使用を避けるべきケース

⚠️ 制限事項

• 1ファイルあたり最大 50,000文字(超過分は切り詰め)

• 大きいファイル(5万文字以上)の全文使用は 最大2個まで

5. チャンキングについて(専門家向け)

本ツールでは、ドキュメントを効率的に処理するために高度なチャンキング(分割)戦略を採用しています。

構造認識型チャンキング

ドキュメントの構造(見出し、セクション)を認識し、意味的なまとまりを保ったまま分割します。

処理フロー

  1. Markdown変換 — DOCX/HTML/TXT → Markdown形式に統一
  2. 構造抽出 — 見出し(#, ##, ###)でセクション分割
  3. 表の保護 — Markdownテーブルは分割せず1チャンクとして保持
  4. Max-Min チャンキング — 大きなセクションは意味的境界で分割

チャンキング設定

パラメータ 説明
MIN_SECTION_SIZE 300文字 これ以下のセクションは次と結合
MAX_SECTION_SIZE 1,200文字 これを超えたらMax-Minで分割

保護される構造

💡 品質向上のポイント

構造が明確なファイル形式(DOCX, Markdown)を使用すると、チャンキングの精度が向上し、検索時に適切なコンテキストが取得されやすくなります。

← アプリに戻る

📚 Upload Guide

Tips and recommended settings for file uploads to maximize report quality.

1. Recommended File Formats

The file format affects how accurately AI can understand document structure (tables, headings, lists).

Format Structure Rating Notes
Markdown (.md) ◎ Complete ⭐⭐⭐ Highly recommended. Clear structure
Word (.docx) ◎ Complete ⭐⭐⭐ Tables & headings accurately recognized
HTML (.html) ○ Good ⭐⭐ Good for web page conversions
Text (.txt) △ Partial Tab-separated tables are recognized
CSV / Excel ◎ Complete ⭐⭐⭐ Best for tabular data
PDF (.pdf) × Lost Not Recommended Conversion recommended

💡 Tip

For the same content, uploading DOCX or Markdown instead of PDF will result in more accurate recognition of tables and headings, producing higher quality reports.

2. PDF Conversion Guide

⚠️ Why is PDF conversion necessary?

PDF format tends to lose structural information (tables, headings, lists), making it difficult for AI to accurately understand documents. Converting to DOCX or Markdown format significantly improves report accuracy.

📝 Method 1: Via Google Docs Recommended Free

  1. Go to Google Drive (drive.google.com)
  2. Upload your PDF file
  3. Right-click the PDF → "Open with""Google Docs"
  4. Once opened, click "File""Download"
  5. Select "Markdown (.md)" or "Microsoft Word (.docx)"
  6. Upload the downloaded file

📘 Method 2: Microsoft Word

  1. Open Microsoft Word
  2. "File""Open" → Select the PDF file
  3. Click "OK" when prompted to convert PDF to editable Word document
  4. "File""Save As"
  5. Set format to "Word Document (.docx)" and save
  6. Upload the saved .docx file

📁 Method 3: Use Original DOCX

If you have the original Word document (.docx) or Markdown file (.md) that was used to create the PDF, upload that instead of the PDF. The original file retains complete structural information.

3. Recommended GSN File Settings

GSN (Goal Structuring Notation) files are important documents representing safety argument structures. Proper settings improve report quality.

📌 Recommended GSN Settings

• Enable "GSN" checkbox → Adds GSN analysis section to report structure

• Enable "Full Text" → Recommended because GSN structure is important

Creating GSN Files

🛠️ Using D-Case Communicator Recommended

  1. Create GSN in D-Case Communicator
  2. Export using "Export LLM Input Text" feature
  3. Upload the exported text file

Manual GSN Text Format

G1: The system can operate safely → S1 S1: Discussion divided into system safety and operational risk control → G2, G3 G2: The system is safe by design → Sn1 Sn1: Design review completion report

Element Types:

4. When to Use Full Text

The "Full Text" option passes the entire file content to AI. Normally RAG (extracting relevant parts) is used, but full text is effective in these cases:

✅ When Full Text is Effective

❌ When to Avoid Full Text

⚠️ Limitations

• Maximum 50,000 characters per file (excess is truncated)

• Full text for large files (50,000+ chars) limited to 2 files max

5. About Chunking (Advanced)

This tool uses advanced chunking (splitting) strategies for efficient document processing.

Structure-Aware Chunking

Recognizes document structure (headings, sections) and splits while maintaining semantic coherence.

Processing Flow

  1. Markdown Conversion — DOCX/HTML/TXT → Unified Markdown format
  2. Structure Extraction — Section splitting by headings (#, ##, ###)
  3. Table Protection — Markdown tables kept as single chunks
  4. Max-Min Chunking — Large sections split at semantic boundaries

Chunking Configuration

Parameter Value Description
MIN_SECTION_SIZE 300 chars Sections smaller than this are merged
MAX_SECTION_SIZE 1,200 chars Sections larger than this are split

Protected Structures

💡 Quality Improvement Tip

Using file formats with clear structure (DOCX, Markdown) improves chunking accuracy and retrieves more appropriate context during search.

← Back to App