系统设计：设计Spotify_程序开发

创始人

2025-07-13 04:50:27

0次

需求: 初始要求是处理50万用户和3000万首歌曲。我们将有播放歌曲的用户和上传歌曲的艺术家。

让我们从估算我们需要的存储开始。首先，我们需要将歌曲存储在某种存储中。

歌曲存储： Spotify等服务通常使用Ogg Vorbis或AAC等格式进行流媒体传输，假设平均歌曲大小为3MB，我们需要3MB * 3000万 = 90TB的存储空间用于歌曲。
歌曲元数据：我们还需要存储歌曲元数据和用户配置文件信息。每首歌平均的元数据大小约为100字节 — 100字节 * 3000万 = 3GB
用户元数据：平均而言，我们将每个用户存储1KB的数据 — 1KB * 50万 = 0.5GB

移动应用：我们将有一个移动应用，是用户与服务互动的前端。用户可以搜索歌曲，播放音乐，创建播放列表等。当用户执行操作（如播放歌曲）时，应用程序将发送请求到后端服务器。
负载均衡器：但在到达服务器之前，我们有一个负载均衡器，用于在多个web服务器之间分发传入流量。这提高了应用程序的可用性和容错性。

Web服务器（API）： Web服务器是处理移动应用程序发来的请求的API。例如，如果用户想播放一首歌，请求将发送到这些Web服务器。服务器然后确定歌曲的位置（在数据库或存储服务中）以及如何检索它。

数据存储将分为两个独立的服务 — 歌曲的Blob存储，我们将在其中存储实际的歌曲文件，以及SQL数据库，我们将在其中存储歌曲和用户元数据。

歌曲 — Blob存储（例如AWS S3、GCP、Azure Blob存储）：实际的歌曲文件存储在Blob（二进制大对象）存储服务中。这些服务设计用于存储大量非结构化数据。
用户、艺术家和歌曲元数据 — SQL数据库：该SQL数据库存储结构化数据，如用户信息（如用户名、密码和电子邮件地址）以及关于歌曲的元数据（如歌曲名称、艺术家名称、专辑详细信息等）。

为什么使用SQL？SQL数据库非常适合这种类型的结构化数据，因为它们允许进行复杂的查询和不同类型数据之间的关系。

每个歌曲文件都存储为“blob”，而SQL数据库通常存储对此文件的引用（如URL）。