使用 QT C++过滤大数据的最佳方式
Best way for filtering BIG data with QT C++
在我开始编写程序之前,我需要建议。 我有大量的数据(~15m行,300 MB txt文件,每行10个简单的数字,用空格分隔,每行都是唯一的数字序列(。 此数据是固定的,不会更改。
我需要在各种条件下过滤这些数据。(例如,搜索具有十个数字中的三个相同的所有序列,或查找具有相同总和的所有序列等(。
QT C++中此任务的推荐方法是什么? 从哪里开始?如何处理数据?将其保存在 txt 文件中并从那里加载或将它们插入到 SQLite。完成此任务的推荐方法是什么?
300 兆字节对于应用程序来说并不是很多内存。TXT文件是最简单的,但你可以使用任何东西。您可以简单地读取C++中的数据并对其进行处理。
通常可以优化基于条件的过滤。但每个需求都有不同的优化。因此,没有一种算法可以快速满足所有标准。
您可以从增量方法开始,遍历所有行并验证条件:
for (size_t i = 0; i < 15000000; ++i)
{
read_line();
if (check_criteria())
save_result();
}
然后研究适用于所有情况的优化解决方案。
相关文章:
- 在c代码之间共享数据的最佳方式
- 使用QQuickFramebufferObject时同步数据的最佳方式是什么
- 从嵌套在std::映射中的std::列表中删除元素的最佳方式
- 如果条件为TRUE(最佳方式?),则在do while循环中后置增量
- 在reactor中存储eventHandlers的最佳方式是什么
- 在AVX通道中混洗的最佳方式
- 从 T 创建 std::future 的最佳方式<T>
- C++:使用 std::unique_ptr 访问重载运算符++的最佳方式?
- 对列表列表中的元素进行分组的最佳方式
- 利用 GPU 的最佳方式
- 使用 QT C++过滤大数据的最佳方式
- 算法设计:用边界数字表示 2D 网格的最佳方式,以C++?
- 在C++中共享键值对的最佳方式
- 为Catch2中的外部文本文件指定路径的最佳方式
- 代表Quarto棋盘游戏棋子的最佳方式
- 等待线程的最佳方式是什么
- 将uint8_t*buffer和size_tbufferlen从C++传递到C中的API函数的最佳方式是什么
- 创建控制台菜单C++的最佳方式
- 只显示片段着色器的最佳方式是什么
- 复制文件的最佳方式是什么,以便我可以在复制过程中轻松取消复制?