分布式 kafka入门，高效读写数据，页缓存+零拷贝技术（十七）

雷迪森博客 2024-01-28 133 0

高效读写数据

1)kafka本身是分布式集群，可以采用集群技术，并行度高 2）读写数据采用稀疏索引，可以快熟定位要消费的数据 3）顺序写磁盘 kafka的producer生产数据，要写入到log文件中，写的过程一直追加到文件的末端，为顺序写，官网有数据表明，同样的磁盘，顺序写能到600M/s，而随机写只有100k/s.这与磁盘的机械结构有关，顺序写之所以块，是因为其能省区了大量磁头寻址的时间

页缓存+零拷贝技术

零拷贝：Kafka的数据加工处理操作由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据，所以就不用走应用层，传输效率高 PageCache页缓存：Kafka重度依赖底层操作系统提供的PageCache功能，当上层有写操作时，操作系统只是将数据写入PageCache.当操作发生时，从PageCache中查找，如果找不到，再从磁盘中读取。实际上PageCache是京可能多的内存都当作了磁盘缓存来使用

参数描述log.flush.interval.messages强制页缓存刷写到磁盘的条数，默认是long最大值，9223372036854775807。，一般不建议修改，交给系统自己管理llog.flush.interval.ms每隔多久，刷数据到磁盘，默认是null,一般不建议修改，交给系统自己管理

评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

本文由用户于 2024-01-28 发布在夸智网，如有疑问，请联系我们。
本文链接：https://www.kuazhi.com/post/713011447.html

夸智网

分布式 kafka入门，高效读写数据，页缓存+零拷贝技术（十七）

数据库 ceph zabbix mysql 【分布式技术】消息队列Kafka

python 开发语言【完美解决】ModuleNotFoundError: No module named ‘numpy‘

发表评论取消回复

夸智网

分布式 kafka入门，高效读写数据，页缓存+零拷贝技术（十七）

数据库 ceph zabbix mysql 【分布式技术】消息队列Kafka

python 开发语言 【完美解决】ModuleNotFoundError: No module named ‘numpy‘

相关文章

发表评论取消回复

python 开发语言【完美解决】ModuleNotFoundError: No module named ‘numpy‘