本发明公开了一种基于改进EXP3算法的水声OFDM资源分配方法,包括以下步骤:S1、初始化权值w(t, m), s=1;S2、增加策略双向步长扩大搜索空间,更新联合信道选择和功率分配的策略集;S3、实时更新自身学习的“探索与利用指数”;S4、计算各个节点策略概率,选择最大值策略概率;S5、根据所选概率效用回值更新策略所占权重,进行下一次迭代计算;S6、判断迭代时间t是否小于迭代总次数T, 若是,返回继续扩大搜素空间,若否,则结束计算,本发明改进EXP3算法,扩大搜索空间,策略更新帮助节点获得最优信道选择和功率分配解,动态参数调节能够提高学习效率,加快收敛速度,且中断概率低,保证水声通信的质量。