Large-scale prediction of protein ubiquitination sites using a multimodal deep architecture

BMC Systems Biology

Table 1 Details of training dataset, validation dataset and independent testing dataset

Data set	Description
Data set	Number of sequences	Number of positive data	Number of negative data	Note
Training	12,100	7733	250,054	Random partitioning in each training iteration
Validation	12,100	1547	50,010	Random partitioning in each training iteration
Testing	1345	6293	46,080	Reservation

ISSN: 1752-0509