https://github.com/microsoft/nni/issues/5134是用了动态分支 (dynamic branches)的原因。改成False就可以输出了。可是我还是没有理解
self.mul = nn.MultiheadAttention(128, 4, batch_first=False)
的意思。以及true和false的区别
【 在 feng321 的大作中提到: 】
: [code=py]
: import torch
: from torch import nn
: ...................
--
FROM 114.99.170.*