数据仓库里的一条脏数据,反向追溯其ETL链路花了我们整整两天。问题出在一个由多个AWS Lambda函数组成的Serverless数据管道上,每个函数处理一个阶段:验证、扩充、加载。当数据量达到每日千万级别时,通过CloudWatch Lo
2023-10-27