大数据 - RayByte-IT开发百宝箱

本文详细介绍了大数据平台默认数据清洗问题的解决办法，以提高数据质量。首先阐述了数据清洗的重要性，接着列举了常见的数据清洗问题，如重复、缺失、错误和不一致数据，并给出了使用Python和Pandas库的详细示例。还分析了不同数据清洗技术的优缺点和注意事项，介绍了数据清洗在金融、医疗、电商等行业的应用场景，最后进行了总结。

大数据数据清洗数据质量

2026

1月

大数据

消息队列消息回溯机制：基于 Kafka 与 RabbitMQ 的历史消息重新消费

2026-01-05 Zhao Jun 1,479 次阅读

本文详细介绍了基于 Kafka 与 RabbitMQ 的消息队列消息回溯机制。首先对 Kafka 和 RabbitMQ 进行了简介，包括它们的特点和示例代码。接着阐述了消息回溯的应用场景，如数据修复、系统升级和测试验证。然后分别介绍了 Kafka 和 RabbitMQ 的消息回溯原理、示例代码、优缺点以及注意事项。最后总结了两种消息队列在消息回溯方面的特点，帮助开发者根据实际需求选择合适的方案。

RabbitMQ Kafka Message Retrospect Historical Message Consumption

第 19 / 19 页