你说得很有道理:在处理股价这类回归问题(连续值预测)时,sigmoid、softmax、tanh 这些非线性函数通常不是首选的变换方式**。 🚫 为什么这些激活函数不适合直接处理股价: 函数 范围 用途 为什么不适合预测股价 sigmoid (0, 1) 二分类/概率输出 会把数值压缩到 (0,1),丢失价格尺度信息 tanh (-1, 1) 中心对称/情绪类模型 同样压缩幅度大,难以还原价格本身 softmax 所有值加和为1 多分类,输出概率分布 完全不适合回归,输出的是类别分布概率 ✅ 那股价处理用什么? 预测股价属于回归问题,目标是还原一个真实的连续值。 推荐方法: 方法…
4 min read
✅ 用 .pth 保存的只是模型的权重参数(state_dict)❌ 并不会保存模型的结构(即 class MyModel(nn.Module): … 的代码) ✅ 解决方法:保存整个模型对象(包括结构 + 权重) PyTorch 提供了另一种方式: pythonCopyEdit# 保存完整模型对象(包含结构和参数) torch.save(model, ‘models/full_model.pt’) 加载时: pythonCopyEdit# 加载完整模型(不需要再次定义 class) model = torch.load(‘models/full_model.pt’) model.eval() ✅…
4 min read
✅ 方法一:固定比例按时间划分(推荐) 比如你有 N 条时间序列样本,按比例切分(例如 80% 训练,20% 测试): pythonCopyEdit# 假设 X 是 (num_samples, window_size, feature_dim) num_samples = X_tensor.shape[0] train_size = int(num_samples * 0.8) X_train = X_tensor[:train_size] y_train =…
4 min read