UDMA CRCエラー
UDMA CRCエラー(SMART 属性 199)は Unraid ユーザーに典型的で、ドライブの健全性レポートにしばしば表示されます。ほとんどのユーザーにとって、これらのエラーはドライブ自体の故障ではなく、ドライブとサーバー間の通信問題を示しています。
CRCエラー が発生すると、ドライブはホストからデータが正しく受信されなかったことを検出します。Unraid はデータを再送信して自動的に復旧を試みます。再送信が成功すれば処理は通常どおり続行されますが、再試行のために書き込み速度が低下する場合があります。これらのイベントは syslog に記録されます。
If recovery attempts fail after several retries, Unraid treats it as a read error. In parity-protected arrays, Unraid will attempt to rewrite the affected sector using parity and data from other drives. If this rewrite is successful, operation resumes; if not, the drive is disabled and marked with a red 'x' in the WebGUI.
CRC エラーとは何か?(技術的な説明) - クリックして展開/折りたたみ
cyclic redundancy check (CRC) は、転送中の生データの偶発的な変更を検出する数学的なチェックサムです。UDMA(ultra direct memory access)の文脈では、CRCエラー はドライブとコントローラー間で送信されたデータがこの整合性チェックに失敗したことを意味します。これは通常、ドライブのプラッタやフラッシュメモリの問題ではなく、緩んだケーブルや不良ケーブルなどの物理的な通信問題を示します。
UDMA CRCエラーの考えられる原因
UDMA CRCエラーは、ドライブとシステム間のデータ転送の問題を示します。これらのエラーを放置すると、データ破損、性能低下、ドライブ障害の原因になる可能性があります。根本原因を理解することで、場当たり的に解決策を探すのではなく、的を絞った修正を実施できます。
確認すべき一般的な原因
- 緩んでいる、または差し込みが不十分な SATA ケーブル: SATA コネクターはそれほど堅牢ではなく、振動やケーブルの張力で簡単に緩むことがあります。ケーブルをきつく束ねるのは避けてください。クロストークや干渉の原因になります。
- 不良な SATA ケーブル: 破損したケーブルや品質の低いケーブルは、CRCエラー の一般的な原因です。
- 電力供給の問題: スプリッターケーブルや電源ユニットの過負荷が原因となることが多い、不十分または不安定な電力は、断続的なエラーを引き起こす可能性があります。
- 未装着のディスクコントローラー: コントローラーカードがスロットに完全に差し込まれていない場合、通信エラーが発生することがあります。
- ドライブのハードウェア障害: 頻度は低いものの、故障しかけているドライブでも CRC エラーが発生することがあります。
- ケーブル管理の問題:
- 結束バンド: ケーブル管理に結束バンドを使う場合は、きつく締めすぎず、ゆるめにしてください。できれば代わりにベルクロストラップを使用してください。
- 電源ケーブルとデータケーブルの配線: 電源ケーブルを SATA データケーブルに沿って配線するのは避けてください。どうしても接触させるか、非常に近づける必要がある場合は、干渉を最小限にするため 90 度で交差させる必要があります。
- SATA ケーブルの曲げ方: 90 度に曲げるために SATA ケーブルを無理に折り曲げないでください。ケーブルを損傷し、通信問題の原因になります。
復旧手順
CRCエラー に気付いたら、最初の手順として、各ドライブの SATA ケーブルと電源ケーブルを注意深く確認し、差し直してください。損傷している、またはしっかり固定できないケーブルは交換してください。エラーが続く場合は、電源ユニットとコントローラー接続を確認し、問題を切り分けるためにケーブルやポートの入れ替えを検討してください。
配線と電源を対処した後も CRCエラー が続く場合は、コントローラーまたはドライブの故障を除外するため、さらに調査が必要になることがあります。
CRC エラー表示の理解
たまに発生するエラーと頻繁に発生するエラー
クリックして展開/折りたたむ
CRCエラー の頻度とパターンを理解することで、対応の緊急度を判断できます。すべてのエラーに即時対応が必要なわけではありませんが、パターンから注意が必要な根本的問題が見えてくることがあります。
たまに発生するエラー(懸念は低い)
数週間または数か月の間に数回の CRCエラー が発生しても、通常は問題ありません。こうした単発の事象は、一時的な電力変動、メンテナンス中のケーブルの動き、または自動的に解消する一過性の問題が原因であることがあります。頻繁に発生するエラー(懸念は高い)
毎日または毎週発生する CRCエラー、あるいはエラー数が急速に増加している場合は、すぐに調査が必要な継続的な問題を示しています。このパターンは、緩んだ接続、不良ケーブル、電源の問題など、時間とともに悪化するハードウェア問題を示すことがよくあります。対処すべきタイミング
エラーが頻繁、または増加傾向にある場合は、すぐに調査してください。配線と電源構成を確認して断続的な問題がないかを調べ、エラー率を監視して悪化の兆候を特定してください。これらの問題は自然に解決することは少なく、より深刻な障害につながる可能性があるため、エラーが続く場合は予防保守を検討してください。保留中セクター数
クリックして展開/折りたたむ
現在の保留中セクター数(SMART 属性 197)は、CRCエラー と並んで表示されることの多い重要な指標です。この組み合わせは、早急な対応と慎重な監視を必要とする深刻な問題を示しています。
保留中セクターは、アクセスしても読み取れない可能性のある、信頼性の低いディスク領域を示します。これらは読み取りエラーを経験したセクターであり、現在はドライブのファームウェアによって問題のある可能性があるものとしてマークされています。保留中セクターが CRCエラー と一緒に現れる場合、通信問題が、データを確実に保存および取得するドライブの能力に物理的な損傷を引き起こしていることを示唆します。
この組み合わせが危険な理由
CRCエラー はドライブとコントローラー間の通信問題を示し、保留中セクターはディスクの一部が信頼性を失いつつあることを示します。この2つが重なると、データ保護が損なわれる可能性のある高リスクな状況になります。別のドライブが故障し、なおかつこのドライブに保留中セクターがある場合、データを復旧できる可能性は大幅に制限され、データ復旧 作業が危険にさらされることがあります。この組み合わせを見たら、次の対応を行ってください:
- 直ちに、まだ保護されていない重要なデータをバックアップしてください。
- 拡張 SMART テストを使用してドライブの健全性を確認し、保留中セクターが増え続ける場合はドライブの交換を検討してください。
- 追加の警告兆候がないか状況を注意深く監視し、ドライブが信頼できなくなった場合に備えて array の再構築ができるよう準備してください。
CRC カウントの持続性
クリックして展開/折りたたむ
ダッシュボードの警告アイコン
クリックして展開/折りたたむ
SMART 警告の確認
クリックして展開/折りたたむ
SMART 警告を確認済みにして消去するには:
- 影響を受けたドライブの横にある オレンジ色の警告アイコン をクリックします
- オプションメニューから 確認済み を選択します
- 求められたら操作を確認します
- アイコンが 緑色 に変わり、確認済みであることを示します
確認済みの動作
- 警告をすぐには表示しないようにします
- 問題を見たことを記録します
- エラー数がさらに増えた場合のみ再通知します
- 根本的な問題の監視を維持します
警告を確認済みにしても根本的な問題は解決されません。Unraid に、その警告を認識したことを伝えるだけです。CRCエラー の根本原因は、引き続き調査して解決する必要があります。