Django on_commit + Celery，在副本環境中的問題解決

DRF 伺服器向 Django 應用伺服器發送 webhook POST 請求，
Django 在接收請求並創建 Post 模型實例的過程中出現了以下問題。

Webhook 回應超時
在創建 Post 對象後，由於 ManyToMany 欄位 categories 和 tags 的處理需要耗時
這導致 webhook 回應延遲，DRF 將此視為失敗
數據一致性未得到保障
如果在後續處理中立即調用 Celery 任務，則會在 tags.add(...) 和 categories.add(...) 工作尚未完成的情況下發出調用
這將導致 Celery 處理不完整的數據的問題
on_commit() 之後 Celery 接收到空數據
儘管使用 on_commit() 確保數據的一致性後調度了 Celery 任務，但在任務內部 tags.all() 的查詢結果仍然顯示為空列表
這是因為 Celery 將讀取操作發送到了副本 DB，而主從同步過程中存在延遲

post = Post.objects.using('default').get(id=post_id)
tags = post.tags.using('default').all()
categories = post.categories.using('default').all()

也可以利用 DB Router 使 Celery 請求始終查詢主 DB

所有組件在單獨的情況下都是正常的，但為了解決分散式架構環境中出現的延遲和數據一致性問題，
不僅需要考慮代碼結構，還需要進行 數據流和時機以及 DB 副本延遲的系統設計。

相似的文章