{"tool":{"slug":"memory-bandwidth-bottleneck-detector","layer":"chips","layer_name":"Chips & Compute","name":"Memory Bandwidth Bottleneck Detector","question":"Is my 70B inference bandwidth-bound on H100?","short_description":"Given a model + accelerator, decide whether you are bandwidth-bound or compute-bound.","status":"coming_soon","inputs":["Model size + batch size","Accelerator","Quantization scheme"],"outputs":["Bandwidth utilization","Compute utilization","Bottleneck verdict + fix list"],"topic_slug":null},"related_tools":[{"slug":"h100-vs-h200-vs-b200-tco","layer":"chips","name":"H100 vs H200 vs B200 TCO","question":"Is upgrading from H100 to B200 worth the cost?","url":"/tools/chips/h100-vs-h200-vs-b200-tco"},{"slug":"inference-cost-calculator","layer":"chips","name":"Inference Cost Calculator","question":"What does it cost to self-host a 70B model at 100k QPS?","url":"/tools/chips/inference-cost-calculator"}],"links":{"page":"/tools/chips/memory-bandwidth-bottleneck-detector","layer_index":"/tools/chips","topic":null},"citation_url":"/tools/chips/memory-bandwidth-bottleneck-detector","generated_at":"2026-05-11T22:07:16.902Z"}