一、软件优点
多模型融合预测
提供 LSTM、GRU、混合模型(CNN+LSTM+GRU+Attention)三种策略,覆盖不同时序特征提取能力,提升预测鲁棒性。数据驱动与特征工程
自动获取官方数据并预处理,包含时间特征(年 / 月 / 日 / 星期)、统计特征(滚动均值 / 标准差)、组合特征(和值 / 奇偶计数 / 质数值)及滞后特征,增强数据表征能力。
标准化处理(MinMaxScaler)确保模型收敛效率。
可视化与可解释性
统计分析模块直观展示红球 / 蓝球历史及近期高频号码分布,支持图表可视化(柱状图)。
预测结果包含模型参数、网络结构说明,提升透明度。
工程化设计
使用 PyQt5 构建 GUI,支持多线程操作(数据获取、模型训练独立线程),避免界面卡顿。
集成异常处理机制(网络检测、文件存在性检查),提升稳定性。
可配置性与灵活性
支持调整训练集比例(50%-95%)、训练轮次(50-1000)、批量大小(16-128)、回溯期数(5-30),适应不同数据规模与训练需求。
二、使用的算法与模型
1. 基础算法
时间序列处理:
滑动窗口(lookback参数)生成序列数据,用于捕捉历史期数的依赖关系。
标准化(MinMaxScaler):将特征缩放到 [0,1] 区间,提升神经网络训练效率。
统计分析:
频率统计:计算红球 / 蓝球出现概率,提取历史及近期高频 TOP10 号码。
质数判断(is_prime函数):用于组合特征中的质数计数。
2. 神经网络模型
3. 关键技术
注意力机制(AttentionLayer):在混合模型中用于加权时序特征,聚焦关键历史期数。
正则化与优化:
L2 正则化抑制过拟合,Dropout 随机失活神经元增强泛化能力。
Adam 优化器动态调整学习率,损失函数为均方误差(MSE),评价指标为平均绝对误差(MAE)。
回调函数:
早停法(EarlyStopping)防止过拟合,模型检查点(ModelCheckpoint)保存最优权重。
三、软件特点
全流程自动化
数据获取→预处理→特征工程→模型训练→预测→可视化全链路自动化,无需人工干预。
多维度分析
结合传统统计分析(高频号码)与深度学习(时序特征),提供 “数据统计 + 模型预测” 双重视角。
工程化部署支持
resource_path函数解决打包后资源路径问题,支持 PyInstaller 等工具打包为独立应用程序。
用户体验优化
进度条实时反馈数据获取与训练状态,状态提示清晰(状态栏、文本框日志)。
界面模块化设计(标签页分离预测与统计功能),操作逻辑简洁。
可扩展性
模型架构通过类方法封装(如create_lstm_model),易于扩展新网络结构或替换组件。
软件来源 52pojie





发表评论