策略调整与遗憾探索