但data哪里来怎么train的最关键环节没公开
但据说能看出开data是pristine的,就是extremely clean,感觉不是raw data,所以好多人猜测是用了gpt处理后的output。
都是猜测。但它公布的算法的确有突破